Слайд 4Свойства коэффициента корреляции

Слайд 6Построение уравнения регрессии

Слайд 7
Чаще всего используются следующие зависимости :
линейная ;
параболическая ;
экспоненциальная .
Оценка параметров осуществляется

методом наименьших квадратов:
Слайд 8Графическая интерпретация
i = 1, 2, … , n

Слайд 12Алгоритм кластерного анализа: K-means
Одной из широко используемых методик кластеризации является разделительная

кластеризация, в соответствии с которой для выборки данных, содержащей n записей, задаётся число кластеров k, которое должно быть сформировано. Затем алгоритм разбивает все объекты выборки на k групп (k К наиболее простым и эффективным алгоритмам кластеризации относится k-means (k-средних). Он состоит из четырёх шагов:
1. Задаётся число кластеров k, которое должно быть сформировано из объектов исходной выборки.
2. Случайным образом выбирается k записей, которые будут служить начальными центрами кластеров.
3. Для каждой записи исходной выборки определяется ближайший к ней центр кластера.
4. Производится вычисление центроидов - центров тяжести кластеров. Это делается путём определения среднего для значений каждого признака всех записей в кластере.
Шаги 3 и 4 повторяются до тех пор, пока не будет выполнено условие в соответствии с некоторым критерием сходимости (чаще всего используется сумма квадратов ошибок между центроидом кластера и всеми вошедшими в него записями).
Остановка алгоритма производится, когда на каждой итерации в каждом кластере остаётся один и тот же набор записей.