Содержание
- 2. Machine learning from scratch: myth or reality? Dmitry Kozlov Kemerovo January 25, 2018 URL: http://goo.gl/V7mvD1
- 3. Data is the new Oil We need to find it, extract it, refine it, distribute it
- 4. The world’s most valuable resource is no longer oil, but data
- 9. Applications of machine learning in real life Fraud Detection Customer churn prediction Credit scoring Image recognition
- 11. Зачем? Возможность получить интересную работу и сложные задачи Развитие интуиции, собственная оценка событий и фактов Общие
- 12. Мотивация, фокус и желание Английский язык (GitHub, arXiv, YouTube, Coursera, Google, etc.) Задавать вопросы на английском
- 13. Какие бывают данные? Табличные данные Временные ряды Изображения Видео Текст Звук Другие...
- 14. С чего начать?
- 15. Начать с практики Столкнуться с проблемами Найти решение в теории Применить решение или вернуться к пункту
- 16. Что нужно помнить? Время ограничено, в том числе на обучение Необходимо декомпозировать сложные задачи Проще начать
- 17. Какие инструменты? Искать популярные инструменты на GitHub Табличные данные (Pandas) Линейный модели (Scikit-learn) Градиентный бустинг (LightGBM,
- 18. Какие ресурсы нужны? Для анализа небольших табличных данных (Pandas, Scikit-learn, XGBoost, LightGBM, etc): Ноутбук / Домашний
- 19. Какие ресурсы нужны для DL?
- 20. Какую IDE выбрать? Jupyter Notebook PyCharm Vim Любую, с которой вы уже знакомы и хорошо ориентируетесь
- 21. Постоянно учиться и узнавать новое Вспоминать лучшие наработки прошлого на практике Погружаться в детали и научные
- 22. Что пригодится? Линейная алгебра Комбинаторика Дискретная математика Теория вероятности Математический анализ Методы оптимизации Дифференциальные уравнения Структуры
- 24. Open Data Science Крупнейшее русскоязычное Data Science сообщество, существует с 2015 года Количество участников на данный
- 25. Что нужно знать про ODS? История сообщений с 2015 года! (Поиск по ключевым словам, каналам и
- 26. Что нужно знать про ODS? Обязательно стоит задавать вопросы в соответствующих тематических каналах (правильный вопрос -
- 27. Что нужно знать про ODS? Ежегодный http://datafest.ru/ Большое количество специалистов из лучших IT-компаний России всегда готовы
- 28. Что нужно знать про ODS? Канал #welcome и #career - здесь вы можете узнать биографию и
- 29. #_meetings_siberia in ODS Сибирская ячейка ODS, каналы: #_meetings_siberia, #_meetings_tomsk (Новосибирск (ЦФТ, 2ГИС, etc), Томск, Барнаул давно
- 30. #_meetings_siberia in ODS
- 31. Тренировки по машинному обучению в Yandex Анонс новых тренировок: https://events.yandex.ru/events/mltr Видео с прошедших тренировок: https://www.youtube.com/channel/UCeq6ZIlvC9SVsfhfKnSvM9w) Календарь
- 32. Платформа для соревнований по машинному обучению мирового уровня с обсуждением задач и общим рейтингом участников
- 33. а решать ? Решать вместе Быстрые проверки гипотез, больше экспериментов Фокус на целевой метрике Учиться на
- 34. Полезные ссылки Тренировки по машинному обучению Видео с тренировок по машинному обучению https://www.coursera.org/learn/competitive-data-science
- 35. Полезные ссылки Machine Learning https://www.coursera.org/specializations/aml Reinforcement learning (#reinfocement_learnin ODS): https://www.youtube.com/watch?v=PtAIh9KSnjo https://www.coursera.org/learn/practical-rl https://www.edx.org/course/reinforcement-learning-explained-microsoft-dat257x http://rll.berkeley.edu/deeprlcourse/ https://www.youtube.com/watch?v=2pWv7GOvuf0
- 36. Полезные ссылки Natural Language Processing (#nlp in ODS): http://web.stanford.edu/class/cs224n/ https://www.youtube.com/watch?v=OQQ-W_63UgQ https://www.coursera.org/learn/language-processing http://deephack.me/ Self-driving cars (#self_driving in
- 37. Полезные ссылки Deep Learning (#deep_learning in ODS): http://vision.stanford.edu/teaching/cs231n/ https://www.coursera.org/specializations/deep-learning https://www.youtube.com/playlist?list=PLC1qU-LWwrF64f4QKQT-Vg5Wr4qEE1Zxk https://www.youtube.com/watch?v=Am82yvUSwRE http://vision.stanford.edu/teaching/cs131_fall1718/ https://www.youtube.com/watch?v=p5SjqD7Ut4Y&list=PLbwKcm5vdiSYL_yEwQ6JIICBA4dMtHNxo
- 38. Полезные ссылки Big Data (#big_data in ODS) http://mattturck.com/wp-content/uploads/2017/05/Matt-Turck-FirstMark-2017-Big-Data-Landscape.png https://www.coursera.org/learn/big-data-essentials https://www.coursera.org/courses?languages=en&query=Yandex
- 39. Полезные ссылки Разбор лучших решений Kaggle: http://ndres.me/kaggle-past-solutions/ https://www.kaggle.com/wiki/PastSolutions http://www.chioka.in/kaggle-competition-solutions/ Блог Александра Дьяконова Беседы с гуру Data
- 40. Полезные ссылки Крупнейшие научные конференции: NIPS, ICML, CVPR, ICCV, KDD Видео: NIPS, ICML, CVPR+ICCV, KDD
- 41. Школы анализа данных: Yandex, Mail.ru https://yandexdataschool.ru/ https://sphere.mail.ru
- 43. Скачать презентацию