Содержание
- 2. Data Science — это работа с большими данными (англ. Big Data). 1 ZB = 10^21 bytes
- 3. Эволюция в области хранения и Обработки данных
- 4. Кто такой Data Scientist?
- 5. Классификация Регрессия Кластеризация
- 6. Независимые переменные Зависимая
- 7. Тренировочные данные, независимые данные. Тестовые данные Независимые переменные зависимые зависимые Исходные данные Модель МО Тестовые данные
- 9. Кластеризация молекул
- 11. Задача на Python c1ccc(c(c1)C(=O)O)O Salicylic acid C1=CC(=C(C=C1N)O)C(=O)O PASA
- 14. Сложности.. У нас есть список из 5 молекул (1 – 5). Нужно рассчитать коэфф. Танимото для
- 15. Трудности…
- 16. Принцип кластеризации
- 17. D B С А
- 18. Расстояние Для кластеризации необходимы: Расстояние Центроиды Цель – найти оптимальные центройды при данном расстоянии
- 19. Не оптимальный центроид Оптимальный центроид
- 20. Гиперпараметр – Tanimoto distance cut-off Чем больше значение расстояния – тем больше кластеры содержат элементов. Тем
- 23. Play with cut-off
- 26. Скачать презентацию