Документы релевантные

Создана поисковая самообучающаяся система с внедренным в нее упрощенным модулем сортировки результатов по релевантности. В качестве документов для наполнения индексов служили справочные руководства по различным темам, преимущественно по компьютерной теме. [c.165]

У.4. — Печать номеров релевантных документов и инвертированного массива по всем запросам. [c.219]

Рост числа научных документов практически исключает возможность ознакомления с ними путем непосредственного чтения или хотя бы просмотра всех документов. Информационный поиск приходится практически проводить, используя поисковые образы документов, отражающие их содержание в краткой форме (рефераты, аннотации, библиографические описания, заглавия). Для этого документы индексируют с использованием строго стандартизованного информационно-поискового языка (ИПЯ)- Информационный поиск состоит в сравнении индексов документов, имеющихся в поисковом массиве, с индексами запросов потребителей (поисковыми предписаниями) при совпадении обоих индексов документ считается релевантным — отвечающим запросу. Степень автоматизации процедуры поиска может быть самой различной от ручных способов до использования мощных ЭВМ. [c.9]

Конкретное числовое значение степени минимального вхождения находится всегда экспериментально для конкретной ИПС и зависит от соотношения между средними размерами поисковых образов документов и запросов. В общем случае пороговым значением принимается В = = 25% (261. Использование критерия частичного вхождения позволяет осуществить эшелонирование выдачи. Это означает, что сначала выдаются релевантные. документы. [c.22]

Применение весовых коэффициентов также позволяет эшелонировать выдачу. При этом порядок выдачи производится в соответствии со степенью релевантности, т. е. сначала выдаются группы сведений с наибольшей суммой весовых коэффициентов, потом — в порядке убывания сумм весов дескрипторов, совпавших в поисковых образах документов и поисковом образе запроса. [c.23]

Отмеченным документом называется такой, о котором доподлинно известно, что он релевантен (то есть соответствует) вполне определенному запросу какого-нибудь абонента системы. Абоненты, по-видимому, могут представлять в качестве запросов отмеченные документы. Если это требование по каким-либо причинам не выполняется, СИАП в состоянии провести поиск по естественным образом сформированному запросу. Если выдача на такой запрос не пустая, она предъявляется абоненту, который может в случае необходимости отметить в ней релевантные документы и вернуть их в СИАП для корректирования первоначальных результатов. Таким образом, СИАП может быть использована как в режиме поиска запрос-документ , так и в режиме отмеченный документ , причем второй режим предпочтительнее . Итак заданы отмеченные документы, релевантные некоторой информационной потребности абонента требуется — на основании анализа Д-наборов этих документов получить О пти1м1изирова -. ные поисковые предписания [c.113]

Па современном этапе развития СИО, когда проблема достаточно полного отражения специфических особенностей информационно-потребительских ситуаций далеко не решена, среди множества документов, предлагаемых в процессе избирательного распространения, лишь небольшая доля оказывается пертинентной. Поэтому выдача копий документов, релевантных с точки зрения системы, при избирательном распространении часто оказывается экономически неоправданной и даже обременительной для потребителя. В этих случаях система ИРИ осуществляет на первом этапе лишь оповещение потребителя, например, путем выдачи списков библиографических описаний (возможно снабженных краткими аннотациями), которые при этом играют роль сигнальной информации. Пользуясь ею, потребитель отбирает те названия документов, которые с большей вероятностью являются для пего действительно пертинентными, и запрашивает их копии. В свою очередь, анализ этих требований на более пер-тинентные документы мон ет служить для уточнения профильных запросов при зтом осуществляется некоторый вид обратной связи потребителя с СИО. [c.28]

Отметим, что требование различения связано с особенностями естественного языка и отсутствует у вопросов, адресованных к информационной системе требование же полноты ответа тесно связано с коэс зфнциентом полноты информационных систем (под коэффициентом полноты поиска понимают отношение числа релевантных документов, найденных при поиске для ответа на данный вопрос, к числу всех документов информационной системы, релевантных данному вопросу). Н. Белнап и Т. Стил обнаружили очень интересную связь между требованием полноты ответа и понятием обобщенного квантора по А. Мостовскому (см. в связи с этим прим. 2 в списке примечаний редакторов, помещенном в конце книги). [c.8]

Предпринята попытка создать интеллектуальный модуль сортировки по релевантности, который накапливает знания о качестве поиска информации по тому или иному запросу. Работа этого модуля основывается на базе знаний о качестве результатов поисков более ранних запросов. Поисковый механизм может определить качество поиска по различньпи критериям, например, спросить у пользователя, насколько удачен получился поиск или по тому, сколько времени он провел на этой странице и т.д. Определив, качественен поиск или нет, система устанавливает связи между запросами и найденными документами, причем вес связи тем больше, чем удачнее (опять же по мнению системы) поиск. [c.165]

У.2. — Поиск документов, отвечающих на запрос, в результате которого номера релевантных документов выдаются в стандартный выводной файл 5У8РКШТ [c.219]

Простейший и наиболее распространенный критерий выдачи состоит в требовании полного вхождения поискового предписания в поисковый образ документа. Но в реальных информационно-поисковых системах критерий полного вхождения практически не обеспечивается. Поэтому широкое применение находит критерий выдачи, основанный на частичном вовпадении поискового образа документа с поисковым предписанием. В этом случае релевантным сч№ тается сведение, в котором количество совпадаюпшх дескрипторов достигает необходимой и достаточной величины. Такое совпадение выдается в ответ на запрос. [c.22]

Требуется найти документы, содержащие ключевые слова РАДИО и ОБРАБОТКА ИНФОРМАЦИИ и имеющие систематический кодМ.21.2. Если количество релевантных сообщений окажется меньше 30, то продолжить поиск, используя дизъюнктивное подсоединение термина ТЕЛЕВИДЕНИЕ. [c.119]

Алгоритм. может осуществлять также проверку. на оригинальность каждой вводимой впервые группы отмеченных документов. Все дескрипторы, входящие в отмеченные, образуют по определению релевантную окрестность (РО). Если оказывается, что РО, вводимая в систему в качестве запроса, пересекается хотя бы с одной из накопленных РО на %, то такую РО назовем квазинеоригинальной. а заданное число W будет являться критерием квазинеорнгинальности. [c.116]

Поясним схему на примере библиотечных процессов поиска. ИПЯ этой системы, как мы уже говорили, являются УДК и язык предметных заголовков. В случае использования УДК роль хранилища поисковых образов выполняет картотека систематического каталога, в которой библиографические карточки сгруппированы по старшинству индексов УДК, выражающих тематику книг и журнальных статей. Поиск по запросу производится механически по индексу УДК, характеризующему содержание запроса в каталоге пужио обнаружить карточки, имеющие индекс, либо совпадающий с индексом запроса, либо содержащий этот индекс в качестве начала. С этих карточек списываются адреса хранения (библиотечные шифры) релевантных документов, по которым они могут быть затребованы из книгохранилища. [c.19]

Первый из этих процессов легко сформулировать в виде точного формального нредписания следует сравнить ряды цифр, образующих записи поискового образа документа, с рядом цифр, составляющих запись перевода запроса если эти ряды цифр полностью совпадают (это случай, когда па языке УДК содержание документа н запроса выражены одинаковым понятием) или если второй ряд цифр полностью совпадает с началом первого ряда цифр (это значит, что поисковый образ документа соответствует более узкому понятию, являющемуся видовым по отношению к понятию, выражающему запрос), то документ следует считать релевантным запросу во всех других случаях документ нужно считать нерелевантным. Этот процесс представляет собой пример простой алгоритмической процедуры, которая —так же как и несколько более сложный, но все же легко формализуемый процесс сопоставления предметных заголовков — может легко быть полностью автоматизирован. Заметим, что при этом от человека, производящего алгоритмический поиск по индексам УДК, совершенно не требуется, чтобы он знал значения этих индексов. Он, равно как и маншна, может не понимать язык УДК и единственно, что от ного требуется, это уметь различать цифры, т. е. знаки, из которых состоят выражения языка УДК. [c.19]

Заметим еще, что в паиболее совершенных автоматизированных ИПС в настоящее время ЭВМ используется для осуществления всех процессов, обозначенных на рис. 3 выше штрих-пунктирной линии. Другими словами, в этих системах не только процессы поиска, но также и перевода с естественного языка документов (или записей фактов), а также запросов на поисковый язык осуществляются автоматически внутри машины. При этом роль активного хранилища ИПС выполняют входящие в состав ЭВМ запоминающие устройства, в частности магнитные ленты и диски, а также фотоскопические, голографические и др. запоминающие устройства. В качестве пассивного хранилища и для целей подготовки (перекодирования) документов (или записей фактов) для их закладки в это хранилище обычно используются специальные более или мепее автономные устройства, которые осуществляют перезапись документов (или фактов) на микрофиль-мовый или видеомагнитный носитель и по сигналам (возможно, поступающим из ЭВМ) об адресах хранения релевантных документов (или записей фактов) производят изготовление и выдачу соответствующих копий. [c.21]

Для оценки качества работы ИПС наиболее часто используются числовые характеристики, именуемые полнотой и точностью поиска. Коэффициент полноты поиска (чаще всего выражаемый в процентах) показывает, какая часть из числа имеющихся в информационном массиве ИПС документов (или фактов), релевантных запросу, выдается системой в ответ на вопрос. Под точностью поиска понимают долю в выдаче системы релевантных запросу документов (или фактов). Если бы ИПС действительно выдавали бы в ответ на запрос все имеющиеся релевантные документы и только их, т. е. если бы они работали без потерь и без липшей (шумовой) выдачи, то коэффициенты полноты и точности поиска равнялись бы 100%. В действительности наилучшие совреметтные автоматизированные документальные ИПС характеризуются либо полнотой поиска порядка 70—80%, либо примерно такими же значениями коэффициента точности. При этом, как правило, чем больше полнота поиска, тем меньше точность, и наоборот. Таким образом, в лучшем случае из десяти релевантных некоторому запросу документов, хранимых в ИПС, система находит н выдает не более 7—8 документов. Кроме того, в лучшем случае из каждого десятка документов, выданных на определенный запрос, только 7—8 документов окажутся действительно релевантными этому запросу, остальные 2—3 документа будут ненужными. Заметим, что эти цифры намного более высокие, чем те, которых можно добиться при помощи традиционных ИПС типа предметных указателей, библиотечных каталогов и т. п. С помощью таких средств можпо более или мепее удовлетворительно отыскать литературу только по достаточно широко тематическим запросам. Когда же речь идет о поиске по конкретному узкому вопросу, их поисковые возможности весьма ограничены. [c.21]

В автоматизированпых документальных поисковых системах широко используется метод установления смысловых связей между запросами и документами, при котором признаки запроса ищутся среди признаков, описывающих содержание документов (метод поиска на вхождение ). Существо этого метода заключается в следующем запросы формулируются в виде перечней поисковых признаков, выраженных индексами слов или словосочетаний. Аналогичным образом представляются и формализованные описания документов. В процессе поиска документ считается релевантным (отвечающим на запрос), если поисковые признаки запроса содержатся среди поисковых признаков, указанных в его формализованном описании. Порядок следования признаков в запросе и сообщении, описывающем документ, не играет роли. [c.68]

Справочник химика 21

Химия и химическая технология