Содержание
- 2. Проблема Проблема проверки уникальности научных документов и нахождения их дубликатов в контексте электронных научных библиотек Новый
- 3. Цель и задачи Цель: разработка сервиса поиска дубликатов в электронных научных библиотеках. Задачи: Исследовать способы организации
- 4. Существующие решения Алгоритм “шинглов”: Физическое представление данных Точность ~91% Неустойчив к мелким изменениям Неустойчив к перестановкам
- 5. Предлагаемое решение Алгоритм TF–RIDF: Точность ~95% Учитывает статистику всей коллекции Устойчив к мелким изменениям Устойчив к
- 6. Серверная часть: Язык программирования – Java Сервер – Spring Boot Многопоточность – Concurrent, Guava Агрегация данных
- 7. Результаты (I часть) Индексация документов электронных научных библиотек: Рекурсивный обход ссылок Диапазон ссылок Рис. 4. Очередь
- 8. Результаты (II часть) Проверка документов на наличие дубликатов: Сбор слов Вычисление значимости слов Сравнение контрольных сумм
- 9. Производительность Диаграмма 1. Тест производительности
- 10. Выводы Свойства системы: Алгоритм TF–RIDF Индексация электронных научных библиотек Быстрая проверка на дубликаты ~200ms
- 12. Скачать презентацию









Виртуальный компьютерный музей
kontroller_klaviatury
Общее представление об автоматизированных информационных системах
Рисуем торт
Файлы и файловые структуры
Презентация на тему Знакомство с языком Паскаль
4_SPARQL
Знакомство с интерфейсом программы Кумир
Человеко-машинное взаимодействие
Использование информационных технологий в дошкольном образовании
Онлайн-конструктора документов Октима
Программирование 3 модуль
Эквайринг и касса в одном устройстве
Виды долговременной памяти. 7 класс
1 урок химия осн (1)
Информационное сопровождение деятельности
Работа с документами
Синий экран смерти BSoD
191588
План презентации
Алгоритм. Лекция 6. Часть 2
Создание Web-сайта
урок 4
Информатика. Информационные технологии
SMM специалист с нуля
Представление информации. Информация графическая числовая
Сокращаем расходы на разработку программного обеспечения и сложных веб-проектов
Капитан Грантов. Лайфхаки грантрайтинга