Математика и статистика для анализа данных

Содержание

Слайд 2

Теория множеств и линейная алгебра

математика и статистика

занятие 3

план занятия

Основные понятия теории множеств
Множества,

Теория множеств и линейная алгебра математика и статистика занятие 3 план занятия
как основа математики
Диаграммы Венна
Операции над множествами
Повторение дифференциального и интегрального исчисления
Матрицы и векторы
Структура set в Python

Слайд 3

Не Паникуй!
Дуглас Адамс – Автостопом по Галактике

Не Паникуй! Дуглас Адамс – Автостопом по Галактике

Слайд 4

План курса

Процесс, генерирующий данные

Данные, которые мы наблюдаем

Вероятность

Статистические выводы
Data Mining

По мотивам L. Wasserman

План курса Процесс, генерирующий данные Данные, которые мы наблюдаем Вероятность Статистические выводы
“All of Statistics”

Слайд 5

Повторение математики

Повторение математики

Слайд 6

Зачем?

Нам нужны ответы на такие вопросы:
Допустим, мы решим, что каждая сторона кости

Зачем? Нам нужны ответы на такие вопросы: Допустим, мы решим, что каждая
выпадает с вероятностью ⅙ . Как понять, с какой вероятностью цифра 5 выпадет на первом броске, если мы кидаем кости 2 раза?
Допустим, мы знаем, как распределена высота населения, то есть какой процент населения имеет какой рост в определенном интервале. Какая вероятность встретить случайно человека с ростом больше 195 см?
Допустим, мы знаем вероятности, что в очереди за IPhone мы будем ждать меньше 10, 20, 30, 40, 50 минут. Какая вероятность, что мы будем ждать 27 ± 2 минуты?

Картинку с кубиками можно заменить. Например, на что-то в таком ключе https://www.shutterstock.com/ru/image-vector/dice-cubes-on-white-background-vector-1034612269

Было бы очень здорово перерисовать эту картинку. Можно только людей с ростом и кривую без текста с процентами.

Слайд 7

Зачем?

Нам нужны ответы на такие вопросы:
Допустим, мы решим, что каждая сторона кости

Зачем? Нам нужны ответы на такие вопросы: Допустим, мы решим, что каждая
выпадает с вероятностью ⅙ . Как решить, с какой вероятностью цифра 5 выпадет на первом броске, если мы кидаем кости 2 раза?

Слайд 8

Зачем?

Нам нужны ответы на такие вопросы:
По каким законам мы можем оперировать с

Зачем? Нам нужны ответы на такие вопросы: По каким законам мы можем оперировать с вероятностью?
вероятностью?

Слайд 9

Зачем?

Нам нужны ответы на такие вопросы:
По каким законам мы можем оперировать с

Зачем? Нам нужны ответы на такие вопросы: По каким законам мы можем
вероятностью?
Допустим, мы знаем, как распределена высота населения, то есть какой процент населения имеет какой рост в определенном интервале. Какая вероятность встретить случайно человека с ростом больше 195 см?

Слайд 10

Зачем?

Нам нужны ответы на такие вопросы:
По каким законам мы можем оперировать с

Зачем? Нам нужны ответы на такие вопросы: По каким законам мы можем
вероятностью?
Как найти площадь под кривой распределения?

Слайд 11

Зачем?

Нам нужны ответы на такие вопросы:
По каким законам мы можем оперировать с

Зачем? Нам нужны ответы на такие вопросы: По каким законам мы можем
вероятностью?
Как найти площадь под кривой распределения?
Допустим, мы знаем вероятности, что в очереди за IPhone мы будем ждать меньше 10, 20, 30, 40, 50 минут. Какая вероятность, что мы будем ждать 27 ± 2 минуты?

Слайд 12

Зачем?

Нам нужны ответы на такие вопросы:
По каким законам мы можем оперировать с

Зачем? Нам нужны ответы на такие вопросы: По каким законам мы можем
вероятностью?
Как найти площадь под кривой распределения?
Как найти распределение, если мы знаем площади под его кривой для различных интервалов

Слайд 13

Ответы

Мы получим ответы на эти вопросы с помощью математических инструментов.
По каким законам

Ответы Мы получим ответы на эти вопросы с помощью математических инструментов. По
мы можем оперировать с вероятностью?
Как найти площадь под кривой распределения?
Как найти распределение, если мы знаем площади под его кривой для различных интервалов

Слайд 14

Ответы

Мы получим ответы на эти вопросы с помощью математических инструментов.
Математическая вероятность на

Ответы Мы получим ответы на эти вопросы с помощью математических инструментов. Математическая
основе Теории множеств
Интегральное исчисление
Дифференциальное исчисление

Слайд 15

Теория Множеств

Теория Множеств

Слайд 16

Что это и зачем?

Наша цель – говорить о результатах случайных процессов (событиях),

Что это и зачем? Наша цель – говорить о результатах случайных процессов
которые нас интересуют и присваивать им вероятности.
Как упадут кости на следующем броске?
Кто выиграет на выборах?
Какой мой шанс выиграть в лото?
Сейчас вероятность для нас все еще слова, которые мы наивно используем…
Фокус этого урока – сами результаты и их описание.

Вероятность

Слайд 17

Что это и зачем?

Наша цель – говорить о результатах случайных процессов (событиях),

Что это и зачем? Наша цель – говорить о результатах случайных процессов
которые нас интересуют и присваивать им вероятности.
Как упадут кости на следующем броске
Кто выиграет на выборах
Какой мой шанс выиграть в лото
Сейчас вероятность для нас все еще слова, которые мы наивно используем…
Фокус этого урока – сами результаты и их описание

Вероятность

Один из возможных результатов броска 2 костей

Слайд 18

Случайные процессы

Процессы, результат которых невозможно точно предсказать:
Бросок монетки или кости
Движение атмосферы и

Случайные процессы Процессы, результат которых невозможно точно предсказать: Бросок монетки или кости
как результат - погода завтра
Выборы президента (мы не знаем точное мнение каждого человека)
Физика станка и качество каждой детали
Возможные результаты процесса можно описать заранее и они взаимно исключают друг друга:
Орел или решка, 1 или 6
Четное число при броске кости
Дождик или сухой день
Клинтон или Буш
Брак или не брак

Слайд 19

Множества

Мы будем использовать множества для описания всех возможных результатов одного случайного процесса.
Множество:

Множества Мы будем использовать множества для описания всех возможных результатов одного случайного
все члены одного шахматного клуба.
Характеристическое свойство: быть членом этого клуба, иметь членскую книжку.
Быть членом одного клуба не мешает быть также членом другого клуба.

Множество: набор, совокупность, собрание каких-либо объектов, которые называются элементами этого множества и обладают общим для всех их характеристическим свойством.

Слайд 20

Примеры множеств

Все результаты броска монетки:
Все результаты броска кости:
Результаты броска кости:
Число 6
Четное число
Число

Примеры множеств Все результаты броска монетки: Все результаты броска кости: Результаты броска
больше 2

Слайд 21

Примеры множеств

Результаты выборов президента
Множество натуральных чисел
Пустое множество
Негативное число как результат броска

Примеры множеств Результаты выборов президента Множество натуральных чисел Пустое множество Негативное число как результат броска кости
кости

Слайд 22

Бесконечные множества

Сколько элементов в множестве натуральных чисел?
Множество вещественных чисел тоже бесконечно, но

Бесконечные множества Сколько элементов в множестве натуральных чисел? Множество вещественных чисел тоже
оно даже не счетное (не обязательное знание для этого курса).
Если есть дальнейший интерес: почитайте о парадоксе Рассела.

Слайд 23

Элементы

Объекты, из которых состоит множество, называют элементами множества.
6-ой элемент множества результатов броска

Элементы Объекты, из которых состоит множество, называют элементами множества. 6-ой элемент множества
кости
7-ой не является результатом броска кости

Слайд 24

Подмножества

Одно множество А может быть подмножеством другого множества B, если все его

Подмножества Одно множество А может быть подмножеством другого множества B, если все
элементы также элементы другого множества.
Множество результатов броска кости больше числа 2 подмножества всех результатов

Слайд 25

Диаграммы Венна

Настоящее или фиктивное множество, все множества, которые нас интересуют, будут считаться

Диаграммы Венна Настоящее или фиктивное множество, все множества, которые нас интересуют, будут считаться подмножеством этого множества
подмножеством этого множества

Слайд 26

Диаграммы Венна

Множество А

А

Диаграммы Венна Множество А А

Слайд 27

Диаграммы Венна

А

Элемент х

Диаграммы Венна А Элемент х

Слайд 28

Диаграммы Венна

А

Подмножество B

B

Диаграммы Венна А Подмножество B B

Слайд 29

Пересечение множеств

А

B

Пересечение множеств А B

Слайд 30

Объединение множеств

А

B

Объединение множеств А B

Слайд 31

Разность множеств

А

B

Разность множеств А B

Слайд 32

Дополнение множеств

А

Дополнение множеств А

Слайд 33

Булеан – множество всех подмножеств

Булеан – множество всех подмножеств

Слайд 34

Дифференциальное исчисление

Дифференциальное исчисление

Слайд 35

Что такое скорость?

Время (t)

Расстояние (s)

90 км

30 км

80 мин

15 мин

Что такое скорость? Время (t) Расстояние (s) 90 км 30 км 80 мин 15 мин

Слайд 36

90 км

Что такое скорость?

Время (t)

Расстояние (s)

30 км

80 мин

15 мин

90 км Что такое скорость? Время (t) Расстояние (s) 30 км 80 мин 15 мин

Слайд 37

90 км

Что такое скорость?

Время (t)

Расстояние (s)

30 км

80 мин

15 мин

Средняя скорость

90 км Что такое скорость? Время (t) Расстояние (s) 30 км 80

Слайд 38

90 км

Какая скорость машины в каждый момент времени?

Время (t)

Расстояние (s)

30 км

80 мин

15

90 км Какая скорость машины в каждый момент времени? Время (t) Расстояние
мин

h

Слайд 39

90 км

Какая скорость машины в каждый момент времени?

Время (t)

Расстояние (s)

30 км

80 мин

15

90 км Какая скорость машины в каждый момент времени? Время (t) Расстояние
мин

h

Слайд 40

90 км

Какая скорость машины в каждый момент времени?

Время (t)

Расстояние (s)

30 км

80 мин

15

90 км Какая скорость машины в каждый момент времени? Время (t) Расстояние
мин

h

Слайд 41

90 км

Какая скорость машины в каждый момент времени?

Время (t)

Расстояние (s)

30 км

80 мин

15

90 км Какая скорость машины в каждый момент времени? Время (t) Расстояние
мин

Слайд 42

Какая скорость машины в каждый момент времени?

Время (t)

Скорость (v)

Какая скорость машины в каждый момент времени? Время (t) Скорость (v)

Слайд 43

Пример с функциями

Пример с функциями

Слайд 44

Примеры дифференциалов

Примеры дифференциалов

Слайд 45

Зачем нам это?

Нам нужно будет знать, где функции принимают свое максимальное или

Зачем нам это? Нам нужно будет знать, где функции принимают свое максимальное
минимальное значение.
Мы будем использовать, что дифференциал принимает в этом месте значение 0!

Слайд 46

Интегральное исчисление

Интегральное исчисление

Слайд 47

Что, если мы знаем только скорость?

Какое расстояние проехала эта машина в

Что, если мы знаем только скорость? Какое расстояние проехала эта машина в
течение 40 мин?

Время (t)

Скорость (v)

40 мин

70 км/ч

Слайд 48

Что, если мы знаем только скорость?

Какое расстояние проехала эта машина в

Что, если мы знаем только скорость? Какое расстояние проехала эта машина в
течение 40 мин?
Расстояние – это
скорость* время
Идея:
Делим время на маленькие интервалы

Время (t)

Скорость (v)

40 мин

70 км/ч

?

Слайд 49

70 км/ч

Что, если мы знаем только скорость?

Какое расстояние проехала эта машина

70 км/ч Что, если мы знаем только скорость? Какое расстояние проехала эта
в течение 40 мин?
Расстояние – это
скорость* время
Идея:
Делим время на маленькие интервалы
Берем скорость в момент начала интервала

Время (t)

Скорость (v)

40 мин

?

Слайд 50

Что, если мы знаем только скорость?

Какое расстояние проехала эта машина в

Что, если мы знаем только скорость? Какое расстояние проехала эта машина в
течение 40 мин?
Расстояние – это
скорость* время
Идея:
Делим время на маленькие интервалы
Берем скорость в момент начала интервала
Умножаем скорость на длину интервала и получаем расстояние, пройденное в этом интервале

Время (t)

Скорость (v)

40 мин

70 км/ч

?

Слайд 51

Что, если мы знаем только скорость?

Какое расстояние проехала эта машина в

Что, если мы знаем только скорость? Какое расстояние проехала эта машина в
течение 40 мин?
Расстояние – это
скорость* время
Идея:
Делим время на маленькие интервалы
Берем скорость в момент начала интервала
Умножаем скорость на длину интервала и получаем расстояние, пройденное в этом интервале
Суммируем все расстояния

Время (t)

Скорость (v)

40 мин

70 км/ч

?

Слайд 52

Что, если мы знаем только скорость?

Какое расстояние проехала эта машина в

Что, если мы знаем только скорость? Какое расстояние проехала эта машина в
течение 40 мин?
Расстояние – это
скорость* время
Наша проблема превратилась в проблему нахождения площади под кривой → интегральное исчисление

Время (t)

Скорость (v)

40 мин

70 км/ч

?

Слайд 53

Что, если мы знаем только скорость?

Какое расстояние проехала эта машина в

Что, если мы знаем только скорость? Какое расстояние проехала эта машина в
течение 40 мин?
Расстояние – это
скорость* время
В следующем шаге нам надо уменьшить ошибку, делая наши отрезки все меньше и меньше

Время (t)

Скорость (v)

40 мин

70 км/ч

?

Слайд 54

Что, если мы знаем только скорость?

Какое расстояние проехала эта машина в

Что, если мы знаем только скорость? Какое расстояние проехала эта машина в
течение 40 мин?
Расстояние – это
скорость* время
В следующем шаге нам надо уменьшить ошибку, делая наши отрезки все меньше и меньше

Время (t)

Скорость (v)

40 мин

70 км/ч

?

Слайд 55

Что, если мы знаем только скорость?

Какое расстояние проехала эта машина в

Что, если мы знаем только скорость? Какое расстояние проехала эта машина в
течение 40 мин?

Время (t)

Скорость (v)

40 мин

70 км/ч

?

Слайд 56

Фундаментальная теорема интегрального и дифференциального исчисления

Фундаментальная теорема интегрального и дифференциального исчисления

Слайд 57

Зачем нам это?

Допустим, мы знаем, как распределена высота населения, то есть какой

Зачем нам это? Допустим, мы знаем, как распределена высота населения, то есть
процент населения имеет какой рост в определенном интервале. Какая вероятность встретить случайно человека с ростом больше 195 см?

195 см

Распределение роста

Вероятность встретить человека с ростом больше 195 см

Слайд 58

Повторение:
Матрицы и векторы

Повторение: Матрицы и векторы

Слайд 59

Векторы

Для анализа данных мы используем понятия из линейной алгебры
Мы не будем часто

Векторы Для анализа данных мы используем понятия из линейной алгебры Мы не
использовать эти методы в этом курсе, но они лежат в основании всей математики для машинного обучения
На прошлом курсе мы видели структуры для описания данных

Имя
Владимир
Иван
Сергей
...

Фамилия
Гончаров
Сикорски
Антонов
...

Возраст
42
76
24
...

Рост
172,6
184,2
192,1
...

Наблюдения

Features (свойства)

Data Frame

Слайд 60

Векторы

Одно наблюдение имеет, например здесь, 4 свойства:
Имя
Фамилия
Возраст
Рост

Имя
Владимир
Иван
Сергей
...

Фамилия
Гончаров
Сикорски
Антонов
...

Возраст
42
76
24
...

Рост
172,6
184,2
192,1
...

Наблюдения

Features (свойства)

Data Frame

Векторы Одно наблюдение имеет, например здесь, 4 свойства: Имя Фамилия Возраст Рост

Слайд 61

Векторы

Одно наблюдение имеет, например здесь, 4 свойства:
Имя
Фамилия
Возраст
Рост
Мы можем представить, что наблюдения живут

Векторы Одно наблюдение имеет, например здесь, 4 свойства: Имя Фамилия Возраст Рост
в четырехмерном пространстве

Имя

Фамилия

Возраст

Рост

наблюдение

Слайд 62

Векторы

Математически более правильно и проще представлять себе это, если каждое свойство число.
Вектор

Векторы Математически более правильно и проще представлять себе это, если каждое свойство
– это математический объект, характеризующийся величиной и направлением.
Типичный пример – это вектор скорости.
Скорость имеет направление и саму величину.

Вектор скорости

Координата z

Координата y

Координата x

Слайд 63

Векторы

Вектор скорости

Координата z

Координата y

Координата x

Векторы Вектор скорости Координата z Координата y Координата x
Имя файла: Математика-и-статистика-для-анализа-данных.pptx
Количество просмотров: 44
Количество скачиваний: 0