Опыт реализации системы контентной фильтрации Интернет-ресурсов на базе технологий АРИОН

Содержание

Слайд 2

Принципы контентной фильтрации

1. Эффективная контентная фильтрация обеспечивается глубоким анализом текстового содержимого Интернет-ресурсов
2.

Принципы контентной фильтрации 1. Эффективная контентная фильтрация обеспечивается глубоким анализом текстового содержимого
Релевантный поиск и проблемный анализ содержимого Интернет-ресурсов должен выполняться специальным программно-аппаратным комплексом
3. Задача комплекса – формирование и «веерное» распространение базы данных запрещенных ресурсов для их последующего блокирования
4. Ресурсы, относящиеся к запрещенной тематике, должны быть классифицированы в соответствии с их информационной направленностью
5. Для каждой категории пользователи может задаваться свой перечень запрещенных классов ресурсов

Слайд 3

Платформа – ИАС «АРИОН»

Платформа – ИАС «АРИОН»

Слайд 4

Ключевые технологии

1. Автономный поиск и автоматическая загрузка текстового содержания ресурсов Интернета
2. Фактографический

Ключевые технологии 1. Автономный поиск и автоматическая загрузка текстового содержания ресурсов Интернета
разбор и тональный анализ текстов на естественном языке
3. Анализ и классификация ресурсов с использованием полнотекстового и фактографического режимов

Слайд 5

Концептуальная схема

Концептуальная схема

Слайд 6

Аналитическая часть

Аналитическая часть

Слайд 7

Сбор информации - Краулер

Назначение
поиск в Интернете ресурсов по заданным критериям
Основные возможности
автономный переход

Сбор информации - Краулер Назначение поиск в Интернете ресурсов по заданным критериям
по ссылкам
использование поисковых машин
извлечение текста из различных форматов: txt, html, rtf, doc, pdf
первичный анализ текстового содержимого (с помощью фильтров)

Слайд 8

Сбор информации

Сбор информации

Слайд 9

Сбор информации

Сбор информации

Слайд 10

Назначение
анализ текстового содержания найденных ресурсов
Основные возможности
Полнотекстовый отбор
мощный язык запросов
учет морфологии
поддержка синонимов и

Назначение анализ текстового содержания найденных ресурсов Основные возможности Полнотекстовый отбор мощный язык
опечаток
Фактографический анализ
графематический анализ
морфологический анализ
синтаксический анализ
логико-семантический анализ
Тональный анализ

Модуль индексирования

Слайд 11

Индексирование

Индексирование

Слайд 12

Индексирование

Индексирование

Слайд 13

Индексирование

Индексирование

Слайд 14

Назначение
автоматическое рубрицирование ресурсов на основании выполненного анализа
Способы рубрицирования
анализ характерных слов и выражений

Назначение автоматическое рубрицирование ресурсов на основании выполненного анализа Способы рубрицирования анализ характерных
(полнотекстовый поиск).
анализ описываемых ситуаций (фактографический поиск)
анализ отношения автора текста к предмету (анализ тональности высказываний)

Модуль рубрикации

Слайд 15

Запросы рубрикации

Запросы рубрикации

Слайд 16

Рубрикация на основе полнотекстового поиска

Рубрикация на основе полнотекстового поиска

Слайд 17

Рубрикация на основе полнотекстового поиска

Рубрикация на основе полнотекстового поиска

Слайд 18

Запросы рубрикации

Запросы рубрикации

Слайд 19

Рубрикация на основе фактографического поиска

Рубрикация на основе фактографического поиска

Слайд 20

Рубрикация на основе фактографического поиска

Рубрикация на основе фактографического поиска

Слайд 21

Рубрикация на основе фактографического поиска

Рубрикация на основе фактографического поиска

Слайд 22

Рубрикация на основе фактографического поиска

Рубрикация на основе фактографического поиска

Слайд 23

Рубрикация на основе фактографического поиска

Рубрикация на основе фактографического поиска

Слайд 24

Запросы рубрикации

Запросы рубрикации

Слайд 25

Рубрикация на основе тональности высказываний

Рубрикация на основе тональности высказываний

Слайд 26

Рубрикация на основе тональности высказываний

Рубрикация на основе тональности высказываний

Слайд 27

Рубрикация на основе тональности высказываний

Рубрикация на основе тональности высказываний

Слайд 28

Рубрикация на основе тональности высказываний

Рубрикация на основе тональности высказываний

Слайд 30

Список запрещенных ресурсов

Формирование и выгрузка списка запрещенных ресурсов

Список запрещенных ресурсов Формирование и выгрузка списка запрещенных ресурсов

Слайд 31

Формирование списка запрещенных ресурсов

Формирование списка запрещенных ресурсов

Слайд 32

Формирование списка запрещенных ресурсов

Формирование списка запрещенных ресурсов

Слайд 33

Формирование списка запрещенных ресурсов

Формирование списка запрещенных ресурсов

Слайд 34

Заключение


Технологии ИАС «АРИОН» в рамках системы контентной фильтрации Интернет-ресурсов обеспечили решение следующих

Заключение Технологии ИАС «АРИОН» в рамках системы контентной фильтрации Интернет-ресурсов обеспечили решение
задач:

Сбор и загрузка текстового содержания искомых ресурсов Интернета
Анализ и классификация ресурсов с использованием полнотекстового и фактографического режимов
Тональный анализ текстов на естественном языке
Формирование списка запрещенных ресурсов

Имя файла: Опыт-реализации-системы-контентной-фильтрации-Интернет-ресурсов-на-базе-технологий-АРИОН.pptx
Количество просмотров: 105
Количество скачиваний: 0