Содержание
- 2. Проблема Проблема проверки уникальности научных документов и нахождения их дубликатов в контексте электронных научных библиотек Новый
- 3. Цель и задачи Цель: разработка сервиса поиска дубликатов в электронных научных библиотеках. Задачи: Исследовать способы организации
- 4. Существующие решения Алгоритм “шинглов”: Физическое представление данных Точность ~91% Неустойчив к мелким изменениям Неустойчив к перестановкам
- 5. Предлагаемое решение Алгоритм TF–RIDF: Точность ~95% Учитывает статистику всей коллекции Устойчив к мелким изменениям Устойчив к
- 6. Серверная часть: Язык программирования – Java Сервер – Spring Boot Многопоточность – Concurrent, Guava Агрегация данных
- 7. Результаты (I часть) Индексация документов электронных научных библиотек: Рекурсивный обход ссылок Диапазон ссылок Рис. 4. Очередь
- 8. Результаты (II часть) Проверка документов на наличие дубликатов: Сбор слов Вычисление значимости слов Сравнение контрольных сумм
- 9. Производительность Диаграмма 1. Тест производительности
- 10. Выводы Свойства системы: Алгоритм TF–RIDF Индексация электронных научных библиотек Быстрая проверка на дубликаты ~200ms
- 12. Скачать презентацию









Алгоритм. Исполнители вокруг нас
Стандарт шифрования данных DES (Data Encryption Standard)
Кодирование информации
A program structure of a Borland C++
Случайные и псевдослучайные числа. Программирование (Python), 8 класс
Разработка вероятностных математических моделей
Линии связи сетей ЭВМ. Занятие 12
Самоаудит отделений boxberry через мобильное приложение Checkpoint
Портал для таможенного оформления товаров для личного пользования (экспресс посылок)
Информационная безопасность
Виртуальная модель АЦП последовательного приближения
Зарубежный опыт создания информационного общества и реализации электронного правительства (аналитический обзор)
Периферийные устройства персонального компьютера
Человеко-машинное взаимодествие. Определение требований к разработке. Лекция4
Учебная практика в ФГБОУ ВО КГЭУ. Использование дистанционных технологий
2D графика
Табличный процессор Excel: составление формул, функции. Работа с листом и данными, оформление таблицы (Лекция 3)
Создание трехмерного мира в SketchUp. Введение в трехмерную графику
Будущее начинается прямо сейчас
Циклические вычислительные процессы. Тема 7
Сравнение общения школьников в социальных сетях и в реальной жизни
Презентация на тему Решение задач части В демоверсии ЕГЭ-2013 по информатике
Объектно-ориентированное визуальное программирование. Знакомство с языком программирования Visual Basic for Application
Программы-процедуры. Правила описания и использования программ-процедур.10 класс
Основы цифровой компетентности и безопасности в сети интернет
Food and Drink
Летающий Автомобиль
Передача телемеханической информации