Исследование звукосимволизма с помощью Word Embedding

Содержание

Слайд 3

ГИПОТЕЗА

Гипотеза: существует систематическая связь между звуком и смыслом.

ГИПОТЕЗА Гипотеза: существует систематическая связь между звуком и смыслом.

Слайд 4

ЦЕЛЬ ПРОЕКТА

Цель: подтверждение или опровержение гипотезы о систематической связи между звуком и

ЦЕЛЬ ПРОЕКТА Цель: подтверждение или опровержение гипотезы о систематической связи между звуком и смыслом.
смыслом.

Слайд 5

WORD EMBEDDING – ГРУППА МЕТОДОВ ПРЕДСТАВЛЕНИЯ СЛОВ В ВИДЕ ВЕКТОРОВ

Контекстно-зависимые:
- Bert

Контекстно-независимые:
- Word2vec
-

WORD EMBEDDING – ГРУППА МЕТОДОВ ПРЕДСТАВЛЕНИЯ СЛОВ В ВИДЕ ВЕКТОРОВ Контекстно-зависимые: -
FastText
- Glove

FastText

Слайд 6

ПЛАН РАБОТЫ

построить семантические оси в пространстве Word Embedding;
построить распределение проекции

ПЛАН РАБОТЫ построить семантические оси в пространстве Word Embedding; построить распределение проекции
слов;
найти статистические данные между распределениями;
проанализировать результаты.

Слайд 7

Суммирование векторов для каждой полуоси

Good - Bad

- Bad

Good

Bad

Суммирование векторов для каждой полуоси Good - Bad - Bad Good Bad

Слайд 8

ПРОЕКЦИИ СЛОВ НА ОСИ

косинусы

количество векторов

ПРОЕКЦИИ СЛОВ НА ОСИ косинусы количество векторов

Слайд 9

СТАТИСТИЧЕСКИЕ ДАННЫЕ

Мы использовали U-тест Манна-Уитни для сравнения двух выборок на идентичность показаний.
p

СТАТИСТИЧЕСКИЕ ДАННЫЕ Мы использовали U-тест Манна-Уитни для сравнения двух выборок на идентичность
- value = 1 – выборки взяты из одного распределения
p - value = 0 – выборки взяты из разных распределений
Использовали р - value < 0.0001

Слайд 11

good-bad

r

dark-luminous

e

– with

– without

good-bad r dark-luminous e – with – without

Слайд 13

quiet-loud

d

difficult - easy

ɪ

– with

– without

– first

quiet-loud d difficult - easy ɪ – with – without – first

Слайд 15

short - long

b

joyful-sad

ə

– with

– without

– first

short - long b joyful-sad ə – with – without – first

Слайд 16

BERT

good-bad

r

– with

– without

– first

BERT good-bad r – with – without – first