Использование графических ускорителей при решении задач обработки текстов

Февраль 19, 2021

Главная
Разное
Использование графических ускорителей при решении задач обработки текстов

Содержание

2. План Что такое GPU и CUDA Алгоритмы анализа данных Задачи обработки текстов
3. GPU и CUDA GPU = Graphic Processing Unit CUDA = Computing Unified Device Architecture
4. Почему графические ускорители (GPU)?
8. Внешний вид
9. Графические процессоры
11. #2 in Top500: NEBULAE 1.27 PFlops Linpack 2.9 PFlops peak
12. CUDA – почти С Единственное отличие – добавления для работы с потоками
13. Архитектура CUDA SIMD мультипроцессоры (8 или 16 ядер) Мультипроцессор имеет регистры и разделяемую (локальную) память Задача
14. Общая для элементов блока Персональная для элемента блока
16. Персональная для элемента блока 16384 * 32bit 16384 byte 65536 B
18. Алгоритмы анализа данных Выявление ассоциативных зависимостей (Association rule mining, Apriori) Классификация (KNN) Кластеризация (K-means) Уменьшение размерности
19. Выявление зависимостей I={i1,...,im} — множество атрибутов База данных — набор записей вида (TID, i1, ..., ip)
20. Алгоритм выявления Найти все частотные 1-наборы Для k=2,... и пока есть новые наборы Построение k-кандидатов: объединение
21. Классификация Метод ближайших соседей Задана выборка объектов с приписанными метками Для нового объекта вычисляется расстояние до
22. Понижение размерности На вход алгоритма поступает матрица расстояний, принцип действия следующий: На плоскости случайным образом фиксируются
23. Производительность на GPU: тысячи точек за секунды
25. Скачать презентацию

План
Что такое GPU и CUDA
Алгоритмы анализа данных
Задачи обработки текстов

GPU и CUDA
GPU = Graphic Processing Unit
CUDA = Computing Unified Device Architecture

Почему графические ускорители (GPU)?

Внешний вид

Графические процессоры

#2 in Top500: NEBULAE
1.27 PFlops Linpack 2.9 PFlops peak

CUDA – почти С
Единственное отличие – добавления для работы с потоками

Архитектура CUDA
SIMD мультипроцессоры (8 или 16 ядер)
Мультипроцессор имеет регистры и разделяемую (локальную)

память
Задача разбивается на блоки, блоки — на потоки
Блоки назначаются на процессоры; выполненный блок невозможно запустить повторно

Общая для элементов блока
Персональная для
элемента блока

Персональная для
элемента блока
16384 * 32bit
16384 byte
65536 B

Алгоритмы анализа данных
Выявление ассоциативных зависимостей (Association rule mining, Apriori)
Классификация (KNN)
Кластеризация (K-means)
Уменьшение размерности

данных

Выявление зависимостей
I={i1,...,im} — множество атрибутов
База данных — набор записей вида (TID, i1,

..., ip)
Частотный k-набор — k-подмножество I, элементы которого встречаются более чем в N записях
Задача: найти все частотные k-наборы
Зависимости: если набор содержит X, то от содержит и x' с вероятностью p

Слайд 20

Алгоритм выявления
Найти все частотные 1-наборы
Для k=2,... и пока есть новые наборы
Построение k-кандидатов:

объединение двух частотных (k-1)-наборов с общим (k-2)-префиксом
Фильтрация: к-кандидат удаляется, если он содержит не частотное (k-1) подмножество
Определение частотности кандидатов

Слайд 21

Классификация
Метод ближайших соседей
Задана выборка объектов с приписанными метками
Для нового объекта вычисляется расстояние

до всех объектов выборки
Метка нового объекта — самая частотная метка его K ближайших соседей из выборки

Слайд 22

Понижение размерности
На вход алгоритма поступает матрица расстояний, принцип действия следующий:
На плоскости случайным

образом фиксируются точки, попарно соединенные пружинами, длины ненапряженных состояний которых берутся из матрицы расстояний. Затем точки отпускаются, и действующие на них силы приводят потенциальную энергию систему к минимуму. Находятся варианты расположения точек, приводящие к минимуму потенциальной энергии и (или) лучше других удовлетворяющие другим формулам оценки качества распределения.
Например, если матрица расстояний строилась по точкам, лежащим на плоскости, то в двумерное пространство точки восстановятся с точностью до поворота и смены знаков осей

Использование графических ускорителей при решении задач обработки текстов

Содержание

Слайд 2

План
Что такое GPU и CUDA
Алгоритмы анализа данных
Задачи обработки текстов

Слайд 3

GPU и CUDA
GPU = Graphic Processing Unit
CUDA = Computing Unified Device Architecture

Слайд 4

Почему графические ускорители (GPU)?

Слайд 5

Слайд 6

Слайд 7

Слайд 8

Внешний вид

Слайд 9

Графические процессоры

Слайд 10

Слайд 11

#2 in Top500: NEBULAE
1.27 PFlops Linpack 2.9 PFlops peak

Слайд 12

CUDA – почти С
Единственное отличие – добавления для работы с потоками

Слайд 13

Архитектура CUDA
SIMD мультипроцессоры (8 или 16 ядер)
Мультипроцессор имеет регистры и разделяемую (локальную)

Слайд 14

Общая для элементов блока
Персональная для
элемента блока

Слайд 15

Слайд 16

Персональная для
элемента блока
16384 * 32bit
16384 byte
65536 B

Слайд 17

Слайд 18

Алгоритмы анализа данных
Выявление ассоциативных зависимостей (Association rule mining, Apriori)
Классификация (KNN)
Кластеризация (K-means)
Уменьшение размерности

Слайд 19

Выявление зависимостей
I={i1,...,im} — множество атрибутов
База данных — набор записей вида (TID, i1,

Слайд 20

Алгоритм выявления
Найти все частотные 1-наборы
Для k=2,... и пока есть новые наборы
Построение k-кандидатов:

Слайд 21

Классификация
Метод ближайших соседей
Задана выборка объектов с приписанными метками
Для нового объекта вычисляется расстояние

Слайд 22

Понижение размерности
На вход алгоритма поступает матрица расстояний, принцип действия следующий:
На плоскости случайным

Слайд 23

Производительность на GPU: тысячи точек за секунды

Использование графических ускорителей при решении задач обработки текстов

Содержание

ПланЧто такое GPU и CUDAАлгоритмы анализа данныхЗадачи обработки текстов

GPU и CUDAGPU = Graphic Processing UnitCUDA = Computing Unified Device Architecture

Почему графические ускорители (GPU)?

Внешний вид

Графические процессоры

#2 in Top500: NEBULAE1.27 PFlops Linpack 2.9 PFlops peak

CUDA – почти СЕдинственное отличие – добавления для работы с потоками

Архитектура CUDASIMD мультипроцессоры (8 или 16 ядер)Мультипроцессор имеет регистры и разделяемую (локальную)

Общая для элементов блокаПерсональная дляэлемента блока

Персональная дляэлемента блока16384 * 32bit16384 byte65536 B

Алгоритмы анализа данныхВыявление ассоциативных зависимостей (Association rule mining, Apriori)Классификация (KNN)Кластеризация (K-means)Уменьшение размерности

Выявление зависимостейI={i1,...,im} — множество атрибутовБаза данных — набор записей вида (TID, i1,

Алгоритм выявленияНайти все частотные 1-наборыДля k=2,... и пока есть новые наборыПостроение k-кандидатов:

КлассификацияМетод ближайших соседейЗадана выборка объектов с приписанными меткамиДля нового объекта вычисляется расстояние

Понижение размерностиНа вход алгоритма поступает матрица расстояний, принцип действия следующий:На плоскости случайным

Производительность на GPU: тысячи точек за секунды

Похожие презентации

План
Что такое GPU и CUDA
Алгоритмы анализа данных
Задачи обработки текстов

GPU и CUDA
GPU = Graphic Processing Unit
CUDA = Computing Unified Device Architecture

#2 in Top500: NEBULAE
1.27 PFlops Linpack 2.9 PFlops peak

CUDA – почти С
Единственное отличие – добавления для работы с потоками

Архитектура CUDA
SIMD мультипроцессоры (8 или 16 ядер)
Мультипроцессор имеет регистры и разделяемую (локальную)

Общая для элементов блока
Персональная для
элемента блока

Персональная для
элемента блока
16384 * 32bit
16384 byte
65536 B

Алгоритмы анализа данных
Выявление ассоциативных зависимостей (Association rule mining, Apriori)
Классификация (KNN)
Кластеризация (K-means)
Уменьшение размерности

Выявление зависимостей
I={i1,...,im} — множество атрибутов
База данных — набор записей вида (TID, i1,

Алгоритм выявления
Найти все частотные 1-наборы
Для k=2,... и пока есть новые наборы
Построение k-кандидатов:

Классификация
Метод ближайших соседей
Задана выборка объектов с приписанными метками
Для нового объекта вычисляется расстояние

Понижение размерности
На вход алгоритма поступает матрица расстояний, принцип действия следующий:
На плоскости случайным