Использование графических ускорителей при решении задач обработки текстов

Содержание

Слайд 2

План

Что такое GPU и CUDA
Алгоритмы анализа данных
Задачи обработки текстов

План Что такое GPU и CUDA Алгоритмы анализа данных Задачи обработки текстов

Слайд 3

GPU и CUDA

GPU = Graphic Processing Unit
CUDA = Computing Unified Device Architecture

GPU и CUDA GPU = Graphic Processing Unit CUDA = Computing Unified Device Architecture

Слайд 4

Почему графические ускорители (GPU)?

Почему графические ускорители (GPU)?

Слайд 8

Внешний вид

Внешний вид

Слайд 9

Графические процессоры

Графические процессоры

Слайд 11

#2 in Top500: NEBULAE

1.27 PFlops Linpack 2.9 PFlops peak

#2 in Top500: NEBULAE 1.27 PFlops Linpack 2.9 PFlops peak

Слайд 12

CUDA – почти С

Единственное отличие – добавления для работы с потоками

CUDA – почти С Единственное отличие – добавления для работы с потоками

Слайд 13

Архитектура CUDA

SIMD мультипроцессоры (8 или 16 ядер)
Мультипроцессор имеет регистры и разделяемую (локальную)

Архитектура CUDA SIMD мультипроцессоры (8 или 16 ядер) Мультипроцессор имеет регистры и
память
Задача разбивается на блоки, блоки — на потоки
Блоки назначаются на процессоры; выполненный блок невозможно запустить повторно

Слайд 14

Общая для элементов блока

Персональная для
элемента блока

Общая для элементов блока Персональная для элемента блока

Слайд 16

Персональная для
элемента блока

16384 * 32bit

16384 byte

65536 B

Персональная для элемента блока 16384 * 32bit 16384 byte 65536 B

Слайд 18

Алгоритмы анализа данных

Выявление ассоциативных зависимостей (Association rule mining, Apriori)
Классификация (KNN)
Кластеризация (K-means)
Уменьшение размерности

Алгоритмы анализа данных Выявление ассоциативных зависимостей (Association rule mining, Apriori) Классификация (KNN)
данных

Слайд 19

Выявление зависимостей

I={i1,...,im} — множество атрибутов
База данных — набор записей вида (TID, i1,

Выявление зависимостей I={i1,...,im} — множество атрибутов База данных — набор записей вида
..., ip)
Частотный k-набор — k-подмножество I, элементы которого встречаются более чем в N записях
Задача: найти все частотные k-наборы
Зависимости: если набор содержит X, то от содержит и x' с вероятностью p

Слайд 20

Алгоритм выявления

Найти все частотные 1-наборы
Для k=2,... и пока есть новые наборы
Построение k-кандидатов:

Алгоритм выявления Найти все частотные 1-наборы Для k=2,... и пока есть новые
объединение двух частотных (k-1)-наборов с общим (k-2)-префиксом
Фильтрация: к-кандидат удаляется, если он содержит не частотное (k-1) подмножество
Определение частотности кандидатов

Слайд 21

Классификация

Метод ближайших соседей
Задана выборка объектов с приписанными метками
Для нового объекта вычисляется расстояние

Классификация Метод ближайших соседей Задана выборка объектов с приписанными метками Для нового
до всех объектов выборки
Метка нового объекта — самая частотная метка его K ближайших соседей из выборки

Слайд 22

Понижение размерности

На вход алгоритма поступает матрица расстояний, принцип действия следующий:
На плоскости случайным

Понижение размерности На вход алгоритма поступает матрица расстояний, принцип действия следующий: На
образом фиксируются точки, попарно соединенные пружинами, длины ненапряженных состояний которых берутся из матрицы расстояний. Затем точки отпускаются, и действующие на них силы приводят потенциальную энергию систему к минимуму. Находятся варианты расположения точек, приводящие к минимуму потенциальной энергии и (или) лучше других удовлетворяющие другим формулам оценки качества распределения.
Например, если матрица расстояний строилась по точкам, лежащим на плоскости, то в двумерное пространство точки восстановятся с точностью до поворота и смены знаков осей

Слайд 23

Производительность на GPU: тысячи точек за секунды

Производительность на GPU: тысячи точек за секунды
Имя файла: Использование-графических-ускорителей-при-решении-задач-обработки-текстов.pptx
Количество просмотров: 126
Количество скачиваний: 0