Содержание
- 2. Проблема Проблема проверки уникальности научных документов и нахождения их дубликатов в контексте электронных научных библиотек Новый
- 3. Цель и задачи Цель: разработка сервиса поиска дубликатов в электронных научных библиотеках. Задачи: Исследовать способы организации
- 4. Существующие решения Алгоритм “шинглов”: Физическое представление данных Точность ~91% Неустойчив к мелким изменениям Неустойчив к перестановкам
- 5. Предлагаемое решение Алгоритм TF–RIDF: Точность ~95% Учитывает статистику всей коллекции Устойчив к мелким изменениям Устойчив к
- 6. Серверная часть: Язык программирования – Java Сервер – Spring Boot Многопоточность – Concurrent, Guava Агрегация данных
- 7. Результаты (I часть) Индексация документов электронных научных библиотек: Рекурсивный обход ссылок Диапазон ссылок Рис. 4. Очередь
- 8. Результаты (II часть) Проверка документов на наличие дубликатов: Сбор слов Вычисление значимости слов Сравнение контрольных сумм
- 9. Производительность Диаграмма 1. Тест производительности
- 10. Выводы Свойства системы: Алгоритм TF–RIDF Индексация электронных научных библиотек Быстрая проверка на дубликаты ~200ms
- 12. Скачать презентацию









Frontend stack
Home Screen
Образование на основе онлайновых социальных сетей
Talking or Texting
Как сделать сердце в Компасе
Электронный журнал Земля Санникова. Издательство Совиная Сказка
Мутационное тестирование программного обеспечения
Функции (продолжение). Лекция 8
Правила сетевого этикета
Обзор выпуска КХСМ от 11 мая 2019 года в скриншотах (интерактив)
Онлайн магазин Avon
Черепаха-графический учебный исполнитель
Компьютерная мышь
Информатика. Введение. 9 класс
Системы счисления
Формировании государственных информационных ресурсов в Республике Таджикистан
Электронная презентация MS Power Point
Работа компьютерных сетей. Домен. Частная виртуальная сеть
Сервис WikiWall
Компьютерные сети. Доменная система имен
Техника безопасности. Правила поведения в компьютерном классе
Разрешите представиться
Ступінь окиснення елементів
Программирование на языке Паскаль
Технология мультимедиа. Ключевые слова
Пэкмен. Обзор. Скайрим – моя жизнь
Поместите здесь ваш текст. Шаблон
Пользовательские типы данных