Поиск информации. Программные поисковые системы

Содержание

Слайд 2

Всемирная паутина
веб-страница, веб-сайт
язык HTML
гиперссылка
браузер
поисковая система
запрос

Всемирная паутина веб-страница, веб-сайт язык HTML гиперссылка браузер поисковая система запрос

Слайд 3

Всемирная паутина – распределённая система, предоставляющая доступ к связанным между собой электронным

Всемирная паутина – распределённая система, предоставляющая доступ к связанным между собой электронным
документам, расположенным на различных компьютерах по всему земному шару, подключенных к Интернету.

Всемирная паутина

Веб-страница может содержать текст, мультимедийные объекты (графическую, аудио- и видеоинформацию), гиперссылки на файлы или другие веб-страницы, а также всевозможные активные компоненты, например, формы, позволяющие установить обратную связь между пользователем и веб-страницей посредством типовых элементов управления (текстовых полей, кнопок и т. п.).

Гиперссылка – некоторое ключевое слово или объект в документе, с которым связан переход к другому документу. Текст, в котором используются гиперссылки, называется гипертекстом.

Веб-сайт – группа веб-страниц, связанных единой темой, общим стилем оформления и взаимными гиперссылками.
Браузер (от англ. browse – просматривать) – специальная программа для просмотра веб-страниц.

Слайд 4

Язык разметки гипертекста

Веб-страница – это файл, содержащий собственно текст, несущий определённую информацию

Язык разметки гипертекста Веб-страница – это файл, содержащий собственно текст, несущий определённую
для пользователя, и служебную информацию для браузера (тэги разметки) на языке HTML (англ. HyperText Markup Language – язык разметки гипертекста).

Тэги разметки представляют собой определённые стандартом HTML последовательности символов, согласно которым браузер располагает текст на экране, включает в него рисунки, хранящиеся в отдельных графических файлах, и формирует гиперсвязи с другими документами или ресурсами Интернета.

CSS (англ. Cascading Style Sheets – каскадные таблицы стилей) – формаль-ный язык описания внешнего вида документа, составленного с использованием языка разметки.
Эта технология позволяет принципиально разделить содержание и представление документа:
описание содержания и логической структуры веб-страницы производится с помощью HTML или других языков разметки;
описание внешнего вида веб-страницы производится с помощью CSS.
Стиль хранится в отдельном CSS-файле, что позволяет создавать документы в едином стиле.

Слайд 5

Схема обработки запросов пользователя

Браузер клиента

Запрос веб-страницы

СУБД
База данных

Запрос к базе данных

Передача данных для

Схема обработки запросов пользователя Браузер клиента Запрос веб-страницы СУБД База данных Запрос
сервера

Веб-страница для пользователя

Взаимодействие клиент–сервер происходит по протоколу HTTP

Сервер

Слайд 6

Поиск информации в сети Интернет

Поисковая система – это программно-­аппаратный комплекс, пред­назначенный для

Поиск информации в сети Интернет Поисковая система – это программно-­аппаратный комплекс, пред­назначенный
поиска информации во Всемирной паутине.
Поисковая машина – программная часть поисковой системы; комплекс программ, предназначенный для поиска информации.

!

Поисковые каталоги, управляемые человеком

Системы, использующие поисковых роботов

Гибридные поисковые системы

ПОИСКОВЫЕ СИСТЕМЫ

содержат базу данных ссылок на веб-сайты, распределённых по отдельным тематичес-ким рубрикам; поиск осуществляется вручную спуском по дереву каталогов

для каждого документа составляется его поисковый образ – набор ключевых слов, отражающих содержание этого документа; поиск осуществляется по запросу

сочетают в себе функции систем, управляемых человеком, и систем, использующих поисковых роботов

Слайд 7

Типы поисковых запросов

Чтобы поиск стал более продуктивным, используйте языки формирования запросов, которые

Типы поисковых запросов Чтобы поиск стал более продуктивным, используйте языки формирования запросов,
есть во всех поисковых системах.

результатом является огромный список всех страниц, содержащих хотя бы одно из ключевых слов

Поиск по любому из слов

в этом режиме формируется список всех страниц, содержащих все ключевые слова в любом порядке

Поиск по всем словам

в результате составляется список всех страниц, содержащих фразу, точно совпадающую с ключевой (знаки препинания игнорируются)

Поиск точно по фразе

Слайд 8

Язык поисковых запросов

Язык поисковых запросов

Слайд 9

ЭФФЕКТИВНОСТЬ (КАЧЕСТВО) ПОИСКА

Оценка эффективности поиска

Точность поиска – это отношение числа выданных релевантных

ЭФФЕКТИВНОСТЬ (КАЧЕСТВО) ПОИСКА Оценка эффективности поиска Точность поиска – это отношение числа
(соответствующих информацион-ному запросу) документов к об-щему числу документов, выданных системой по данному запросу.
Значение этого параметра колеб-лется от 0,1 до 1.

Полнота поиска – это отношение числа выданных релевантных доку-ментов к общему числу релевантных документов, имею-щихся в базе данных поисковой системы.
В идеале это число должно равняться 1; на практике может достигать значений 0,7–0,9.

Слайд 10

Достоверность информации на веб-ресурсах

Выяснение репутации сайта
Проверенные данные публикуют официальные сайты государственных, коммерческих,

Достоверность информации на веб-ресурсах Выяснение репутации сайта Проверенные данные публикуют официальные сайты
научных и других структур, являющиеся первоисточни-ками информации. Ответственность за любую опубликованную ими информацию несут ресурсы, имеющие свидетельство о регистрации средства массовой информации.

Проверка фактического
материала
Фактические и статистические дан-ные можно выборочно сверить с официальными источниками. Они должны согласоваться с тем, что вы изучали в школе или узнали из других проверенных источников.

Получение информации об авторе материала
Убедиться, что на сайте приведены данные об авторе (ФИО, квали-фикация, контактная информация и т.п.). Можно найти и ознако-миться с другими работами этого автора, отзывами на его работы.

Слайд 11

Веб-страница – это файл, содержащий собственно текст, несущий определённую информацию для пользователя,

Веб-страница – это файл, содержащий собственно текст, несущий определённую информацию для пользователя,
и служебную информацию для браузера (тэги разметки) на языке HTML (англ. HyperText Markup Language – язык разметки гипертекста).
HTML – один из веб-стандартов, по которым разрабатываются сайты во всём мире. Ещё одним из таких стандартов является технология CSS (англ. Cascading Style Sheets – каскадные таблицы стилей) – формальный язык описания внешнего вида документа, составленного с использованием языка разметки.
Технология CSS позволяет принципиально разделить содержание и представление документа: описание содержания и логической структуры веб-страницы производится с помощью HTML или других языков разметки, а описание внешнего вида веб-страницы производится с помощью CSS.

Слайд 12

Веб-страницы предназначены для воспроизведения на самых разных экранах самых разных компьютеров. Поэтому

Веб-страницы предназначены для воспроизведения на самых разных экранах самых разных компьютеров. Поэтому
они не имеют «жёсткого» форматирования. Оформление веб-страницы выполняется непосред-ственно во время её воспроизведения на компьютере клиента в соответствии с настройками используемого браузера.
Поисковая система – это программно-аппаратный комплекс, предназначенный для поиска информации во Всемирной паутине. Поисковая машина – программная часть поисковой системы; комплекс программ, предназначенный для поиска информации.
По принципу действия поисковые системы делят на: поисковые каталоги, управляемые человеком; системы, использующие поисковых роботов; гибридные поисковые системы.
Важные данные, найденные в Интернете, необходимо проверять: выяснить репутацию сайта; получить информацию об авторе материала; проверить факты по данным из авторитетных источников.

Слайд 13

Вопросы и задания

Задание 1. В языке запросов некой поисковой машины для обозначения

Вопросы и задания Задание 1. В языке запросов некой поисковой машины для
логической операции ИЛИ используется символ «|», а для логической операции И — символ «&». Известны запросы и количество найденных по ним страниц некоторого сегмента сети Интернет:

Сколько страниц (в миллионах) будет найдено по запросу
Информатика & (Математика| Физика) ?

Решение

Слайд 14

Вопросы и задания

Решение:

Представим условие задачи с помощью кругов Эйлера и решим задачу

Вопросы и задания Решение: Представим условие задачи с помощью кругов Эйлера и
на языке множеств.

Пусть И, М и Ф – множества страниц, содержа-щих слова «информатика», «математика» и «физика» соответственно.

Тогда И ∩ М ∩ Ф – множество страниц, соответствующих запросу «Информатика & Математика & Физика».

Его мощность равна 12 (млн):
|И ∩ М ∩ Ф| = 12.

Аналогично:
|И ∩ М| = 26,

|И ∩ Ф| = 34.

Требуется найти мощность множества
И ∩ (М ∪ Ф).

|И ∩ М ∩ Ф| = 12, |И ∩ М| = 26, |И ∩ Ф| = 34, И ∩ (М ∪ Ф) = ?

Преобразуем выражение:
И ∩ (М ∪ Ф) = (И ∩ М) ∪ (И ∩ Ф).

Вспомним принцип включений-исключений для двух множеств: |X ∪ Y| = |X| + |Y| – |X ∩ Y|.
Тогда |(И ∩ М) ∪ (И ∩ Ф)| =
= | И ∩ М | + | И ∩ Ф| – |(И ∩ М) ∩ (И ∩ Ф)| =
= |И ∩ М| + |И ∩ Ф| – |И ∩ М ∩ Ф| =
= 26 + 34 - 12 = 48.

Ответ: 48 (млн).

Имя файла: Поиск-информации.-Программные-поисковые-системы.pptx
Количество просмотров: 40
Количество скачиваний: 0