Как начать изучение Machine Learning

Содержание

Слайд 2

О чем рассказ
Кто и что изучает: обо мне и о machine learning
Пошаговый

О чем рассказ Кто и что изучает: обо мне и о machine
план
Курсы и другие способы обучения
Советы и выводы

2 / 12

Слайд 3

Мои исходные данные

Образование – математика и информатика
9 лет в разработке программного обеспечения
2

Мои исходные данные Образование – математика и информатика 9 лет в разработке
года декрета:
потеря квалификации
низкий доход
нет свободного времени
кризис поисков смысла и призвания
Интерес к популярной теме machine learning & big data

3 / 12

Слайд 4

Что такое Big Data и Machine Learning?
Big data - данные, слишком большие для обычных

Что такое Big Data и Machine Learning? Big data - данные, слишком
программ (баз данных)
В широком смысле – это сбор, хранение, анализ, поиск, передача, визуализация, обновление и безопасность данных
В узком смысле – анализ и предсказания по большим наборам данных
Machine Learning – методы обработки, анализа и стуктурирования больших данных, которые позволяют компьютеру обучаться без задания конкретной программы выдачи ответов.

Зачем это изучать?

Диаграмма с www.linkedin.com из статьи Srikanth Victory

4 / 12

Слайд 5

План для начинающих

+ Английский язык

+ Навыки поиска в интернете

Картинка с analyticsvidhya.com

+ Свободное

План для начинающих + Английский язык + Навыки поиска в интернете Картинка
время

1.

2.

3.

4.

5.

6.

5 / 12

Слайд 6

Coursera: Machine Learning by Andrew Ng

Хороший курс для начала, если есть база

Coursera: Machine Learning by Andrew Ng Хороший курс для начала, если есть
в английском и программировании

+ Подробные, чёткие объяснения
+ Средний уровень детализации
+ Много примеров и диаграмм
+ Большой круг задач и алгоритмов
+ Преподаватель - всемирно известный учёный, основатель платформы Coursera
+ Есть русские субтитры
+ №2 по популярности и №4 по рейтингу среди всех курсов Coursera
Возможные трудности:
- Много программирования
- Аудио, слайды, задания и материалы на английском
- Есть неточности, поправки нужно искать на форумах

«Excellent machine learning course for beginners like me. Professor Andrew Ng has explained details of machine learning in very systematic, simple and clear terms.»

Позволит разобраться в базовых алгоритмах и концепциях

6 / 12

Слайд 7

Специализация «Машинное обучение и анализ данных» на Coursera

+ Русский язык
+ Богатая учебная

Специализация «Машинное обучение и анализ данных» на Coursera + Русский язык +
программа
+ Создатели курса признанные специалисты в обработке данных
+ Активное сообщество в Slack
+ Много практики на Python
- Много математического анализа и теории вероятностей
- Не все темы одинаково подробно изложены
- Часть заданий закрыта при бесплатном просмотре, полная стоимость ~15 000 р.
- Специализация из 6 курсов – это долго

«Много практики. Нагрузка довольно высокая, особенно для работающего человека. Некоторые моменты в лекциях освещаются очень поверхностно, а порой на слушателя просто вываливаются большие формулы, а пояснение дано к ним в двух словах. В этом плане классический ml class с Andrew Ng мне понравился больше, т.к. теория там дана была более подробно, но зато было меньше практики (а тут плюс текущему курсу).»

, но круто, если пройдёте

Поможет найти первую работу, связанную с данными

7 / 12

Слайд 8

Udemi Data Science A-Z™: Real-Life Data Science Exercises Included

+ Примеры на Python

Udemi Data Science A-Z™: Real-Life Data Science Exercises Included + Примеры на
и R
+ Много задач из реального бизнеса
+ Большой обзор методов анализа данных
+ Различные представления данных и программы для их обработки
+ Хороший курс для новичка
- Немного теории (математики, алгоритмов)
- Немного и практических заданий
- Цена = 10-15$

Well in terms of flow of topics and covering the fundamentals. It does add great value to beginners. 

This course is the clear winner in terms of breadth and depth of coverage of the data science process of the 20+ courses I qualified.

Помогает сориентироваться в методах и областях анализа данных

8 / 12

Слайд 9

Ресурсы и новости на русском

Видео с конкурсов Avito contest. Сложно, но интересно
http://ods.ai/

Ресурсы и новости на русском Видео с конкурсов Avito contest. Сложно, но
– Slack-канал про анализ данных в России. Встречи, тренинги, совместное решение задач, помощь коллег, вакансии
Открытый курс по машинному обучению на Хабрахабре. Для продвинутых - много математики и программирования
https://habrahabr.ru/ – самый полезный ресурс по IT
https://www.it52.info/ – курсы и встречи программистов и тестировщиков в Нижнем Новгороде. Telegram-канал @it52info

9 / 12

Слайд 10

Как ещё учиться

Чемпионаты по анализу данных на платформе Kaggle
Брать известные наборы данных,

Как ещё учиться Чемпионаты по анализу данных на платформе Kaggle Брать известные
анализировать, описывать на своём сайте или блоге, выкладывать модели на github
Использовать анализ данных в повседневной работе
Пройти программу типа DataQuest (~1800 р. / мес)
Читать бесплатный e-mail курс по основам машинного обучения (на английском)
Проходить курсы Online masters degree in data science (на английском)

10 / 12

Слайд 11

Советы
Мотивация возникает только в процессе деятельности при правильной наргузке. Трудно начать, но

Советы Мотивация возникает только в процессе деятельности при правильной наргузке. Трудно начать,
надо.
Оптимальная нагрузка = умеренно сложно + интересно
Английский язык – важен. Для этой области придётся его знать и улучшать.
Не жалеть себя, не опираться на мужчин (или родителей, друзей) в серьёзных делах. Но трудиться сообща, помогать взаимно
Найти единомышленников и держать связь: блоги, чаты, обеденная компания на работе, участники одного курса
Писать код

11 / 12