3. Задачи поиска информации. Критерии
поиска информации.
- Полнотекстовый поиск — поиск по всему содержимому
документа.
- Поиск по метаданным — это поиск по неким атрибутам
документа, поддерживаемым системой — название документа, дата
создания, размер, автор и т. д.
- Поиск по изображению — поиск по содержанию
изображения. Поисковая система распознает содержание фотографии.
Методы поиска
- Адресный поиск - процесс поиска документов по чисто формальным
признакам, указанным в запросе (условия - наличие у документа точного
адреса, обеспечение строгого порядка расположения документов в
запоминающем устройстве или в хранилище системы)
- Семантический поиск - процесс поиска документов по их содержанию.
(условия: перевод содержания с естественного языка на
информационно-поисковый язык и составление поисковых образов документа и
запроса, составление поискового описания, в котором указывается
дополнительное условие поиска)
- Документальный поиск - процесс поиска в хранилище информационно-поисковой
системы первичных документов или в базе данных вторичных документов,
соответствующих запросу пользователя (виды: библиотечный, направленный на
нахождение первичных документов; библиографический, направленный на
нахождение сведений о документах, представленных в виде библиографических
записей)
- Фактографический поиск - процесс поиска фактов, соответствующих
информационному запросу. (виды: документально-фактографический,
заключается в поиске в документах фрагментов текста, содержащих факты; фактологический
(описание фактов), предполагающий создание новых фактографических описаний
в процессе поиска путем логической переработки найденной фактографической
информации)
Критерии поиска
- Критерий соответствия - Признак или совокупность признаков, по которым
определяется степень соответствия между запросом или поисковым
предписанием и поисковым образом документа, самим документом или записью
его части для принятия решения о выдаче или не выдаче конкретного
документа на информационный запрос, обрабатываемый системой.
- Критерий смыслового соответствия, критерий релевантности
(документов, данных) - Признак или совокупность признаков, по которым
определяется степень смыслового соответствия между содержанием поискового
предписания и поискового образа документа, самим документом или записью
его части для принятия решения о выдаче или не выдаче конкретного
документа на информационный запрос , обрабатываемый системой.
- Критерий формального соответствия - Признак или совокупность
признаков, по которым определяется степень формального соответствия между
поисковым предписанием и поисковым образом документа , самим документом
или записью его части для принятия решения о выдаче или не выдаче
конкретного документа на информационный запрос, обрабатываемый системой.
- Релевантность - Характеристика степени соответствия смыслового
содержания документа, найденного в результате поиска, содержанию
информационного запроса.
- Пертинентность - Характеристика
степени соответствия документа или данных, найденных в результате поиска,
информационной потребности пользователя, выраженной в его запросе .
- Точность поиска, коэффициент точности поиска/выдачи -
Количественная характеристика результатов информационного поиска .
Точность поиска определяется путем деления количества выданных в результате
выполнения поиска релевантных (см. релевантность ) документов на общее
число выданных документов (релевантных и не релевантных). Данный
показатель используется также для оценки качества информационно-поисковых
систем .
- Коэффициент информационного шума, коэффициент шума -
Количественная характеристика информационного поиска. Коэффициент
информационного шума (ИШ) определяется путем
деления количества выданных в результате выполнения поиска нерелевантных
документов (см. релевантность ) на общее число выданных документов
(релевантных и не релевантных). Будучи выраженным в процентах, ИШ = 100%;- ТП=0 . Данный показатель используется
также для оценки качества информационно-поисковых систем .
- Полнота поиска, коэффициент полноты поиска - Количественная характеристика
результатов информационного поиска, которая определяется путем деления
количества выданных в результате выполнения поиска релевантных (см.
релевантность) документов на общее число релевантных документов, имеющихся
в информационно-поисковой системе (выданных и не выданных). Данный
показатель используется также для оценки качества информационно-поисковых
систем,
- Коэффициент потерь - Количественная характеристика результатов
информационного поиска . Коэффициент потерь (КП)
определяется путем деления количества не выданных в результате выполнения
поиска релевантных документов (см. релевантность ) на общее число
релевантных документов, имеющихся в информационно-поисковой системе
(выданных и не выданных). Будучи выраженным в процентах, КП = 100% - полнота поиска . Данный показатель
используется также для оценки качества информационно-поисковых систем.
- Оперативность (время) поиска - время, затрачиваемое на выполнение
поиска, с момента формирования задания и выдачи команды на производство
поиска до момента получения его результатов; в ЭВМ - Время, затрачиваемое
головкой чтения/записи дисковода (накопителя), для того, чтобы достичь
определенного элемента данных, записанного на диске, дискете или другом
носителе данных внешней памяти ЭВМ.