Слайд 3ГИПОТЕЗА
Гипотеза: существует систематическая связь между звуком и смыслом.
Слайд 4ЦЕЛЬ ПРОЕКТА
Цель: подтверждение или опровержение гипотезы о систематической связи между звуком и
смыслом.
Слайд 5WORD EMBEDDING – ГРУППА МЕТОДОВ ПРЕДСТАВЛЕНИЯ СЛОВ В ВИДЕ ВЕКТОРОВ
Контекстно-зависимые:
- Bert
Контекстно-независимые:
- Word2vec
-
Слайд 6ПЛАН РАБОТЫ
построить семантические оси в пространстве Word Embedding;
построить распределение проекции
слов;
найти статистические данные между распределениями;
проанализировать результаты.
Слайд 7Суммирование векторов для каждой полуоси
Good - Bad
- Bad
Good
Bad
Слайд 8ПРОЕКЦИИ СЛОВ НА ОСИ
косинусы
количество векторов
Слайд 9СТАТИСТИЧЕСКИЕ ДАННЫЕ
Мы использовали U-тест Манна-Уитни для сравнения двух выборок на идентичность показаний.
p
- value = 1 – выборки взяты из одного распределения
p - value = 0 – выборки взяты из разных распределений
Использовали р - value < 0.0001
Слайд 11good-bad
r
dark-luminous
e
– with
– without
Слайд 13quiet-loud
d
difficult - easy
ɪ
– with
– without
– first
Слайд 15short - long
b
joyful-sad
ə
– with
– without
– first
Слайд 16BERT
good-bad
r
– with
– without
– first