Справочник химика 21

Химия и химическая технология

Статьи Рисунки Таблицы О сайте English

Словарь наименований понятий

    При установлении смысловых связей с помощью словаря наименований понятий пословные коды терминов сопоставляются и проверяются на вхождение друг в друга. Два термина считаются связанными по смыслу, если совпадают коды их главных слов и все коды слов одного из терминов содержатся среди кодов слов другого термина. Если количество слов в обоих терминах одинаковое, то такие термины считаются эквивалентными по смыслу если разное, то более узким по смыслу считается термин, состоящий из большего количества слов. [c.186]


    Дополнительный словарь основ слов (для приближенного морфологического анализа) Словарь наименований понятий (СНП) Классификационный словарь понятий (КСП) Обращенный классификационный словарь понятий [c.188]

    Основной словарь основ слов (табл. 10.3) был составлен по неформализованным текстам и включал 4000 наиболее часто встречающихся основ. Дополнительный словарь составлялся по тезаурусу. Он содержал только такие основы слов, которые отсутствовали в основном словаре. Словарь наименований понятий (словарь пословных кодов терминов) формировался на основе словаря их побуквенных кодов. Последний использовался также для декодирования результатов поиска в словарях. [c.188]

    Количество смысловых связей, выявленных при раздельном поиске в словаре наименований понятий и в классификационном словаре, меньше количества связей, выявленных при совместном- однократном поиске в этих словарях (на 3—6%). [c.191]

    Совместный циклический поиск по словарю наименований понятий и классификационному словарю обеспечивает наиболее полное- выявление смысловых связей между терминами. По сравнению с совместным однократным поиском в этих словарях он позволяет выявить примерно а 40% связей больше (см. строки 5—8 табл. 10.4). [c.191]

    Автоматическое установление смысловых связей между наименованиями понятий здесь можно реализовать следующим образом. Исходное словосочетание сначала кодируется пословно и для каждого слова по таблице родо-видовых отношений выбираются номера смысловых эквивалентов подчиненных ему слов, затем производится поиск по словарю наименований понятий. В процессе поиска отбираются номера словосочетаний, эквивалентных по смыслу исходному или подчиненных ему. При этом требуется выполнение двух условий  [c.193]

    Поиск наименований понятий, более широких по объему, чем исходные словосочетания, производится аналогичным образом, но перед обращением к словарю наименований понятий для каждого слова исходного словосочетания по таблице родо-видовых отношений выбирается перечень номеров смысловых эквивалентов подчиняющих слов. [c.194]

    При работе автоматизированных ИПС широко используются словари различного наз.начения (словари словоформ, словари основ слов, словари наименований понятий). Составление словарей — задача весьма трудоемкая. Естественным поэтому является стремление автоматизировать этот процесс. Но если процесс составления словарей словоформ легко автоматизируется, то сложнее дело обстоит со словарями основ слов и словосочетаний. [c.195]

    Составление словарей Наименований понятий на ЭВМ [c.202]

    Составление словаря наименований понятий начинается с пословного кодирования исходного списка имен -ных словосочетаний. Затем производится синтаксический анализ, в результате которого каждое наименование понятия представляется в виде сочетания номеров основ и сопровождается номером грамматической структуры. При этом в сочетании номеров основ на первом месте ставится номер главного слова наименования понятия, а в структурной формуле главному слову и определяющим его прилагательным назначается информация име--нительный падеж единственного числа . Заключительным этапом составления словаря является сортировка кодов наименований понятий с исключением повторений одинаковых элементов. [c.202]


    Участие человека можно исключить, если применять приближенные методы кодирования наименований понятий, рассмотренные в гл. 9. Эти методы редко приводят к ложному отождествлению разных по смыслу понятий и они весьма просты в реализации. Резко упрощается и процедура автоматического составления словарей наименований понятий. Например, можно составлять словарь следующим образом. После пословного кодирования словосочетаний в их кодах на первое место ставится, номер главного слова, а все другие номера слов упорядочиваются по возрастанию их величины. Далее полученные коды сортируются с исключением повторений одинаковых элементов. При таком подходе автоматически учитываются трансформации с перестановками слов, а если в процессе пословного кодирования заменить номера основ слов на номера их смысловых эквивалентов, то будут учтены и трансформации с изменением основ слов. [c.203]

    Описанные процедуры автоматического составления словаря наименований понятий основаны на серийной обработке всего исходного списка словосочетаний. Они неудобны для пополнения словарей и для внесения в них изменений. Более удобными в этом отношении являются ассоциативно-адресные методы, и в частности узловой способ, описанный в гл. 5 и 6. Этот способ позволяет составлять словарь наименований понятий с нуля и вносить в него любые изменения. [c.203]

    Требования, предъявляемые к словарю наименований понятий в процессе кодирования и декодирования информации, противоречивы. В процессе кодирования решается задача распознавания терминов, и здесь требуется приводить трансформационные варианты словосочетаний к канонической форме. При этом может теряться информация о порядке следования и о Формах слов [c.203]

    Перечни дескрипторных понятий, используемых в ИПС, обычно оформляются в виде словарей-тезаурусов, в которых отражаются отношения эквивалентности и подчинения, а также указываются связи между близкими по смыслу понятиями. Тезаурус совмещает в себе функции словаря наименований понятий и словаря классификационных связей. [c.214]

    Поиск по словарю наименований понятий и его пополнение [c.234]

    Полнота установления смысловых связей между понятиями при индексировании может быть сушественно увеличена, если наряду со словарем основ слов и словарем наименований понятий использовать словарь родовидовых связей слов. При этом понятие А тезауруса может быть использовано для замены исходного понятия В, если для каждого слова наименования понятия А в наименовании понятия В находится либо эквивалентное ему по смыслу слово, либо слово, выражающее более узкое по объему понятие. В обоих наименованиях понятий схемы связей соответствующих слов должны совпадать. [c.257]

    Таким образом, чтобы перевести тексты рефератов и запросов в машинную форму представления и обеспечить высокий уровень полноты выдачи информации при поиске, необходим автоматический тезаурус. В состав тезауруса должны входить словарь основ слов, словарь смысловых связей слов, словарь наименований понятий и классификационный словарь понятий. [c.261]

    В процессе индексирования целесообразно проверять на вхождение в текст реферата не все термины тезауруса, а только такие, которые содержат в своем составе хотя бы по одному слову из текста или хотя бы по одному слову, выражающему более широкое понятие, чем слово из текста. Эти термины легко могут быть выбраны, если словарь наименований понятий будет представлен в памяти ЭВМ в виде узловой ассоциативно-адресной структуры. [c.263]

    Зависимость объема словаря словоформ от объема словаря наименований понятий (получена по словарю объемом 11 620 словосочетаний) [c.266]

    Зависимость объема словаря основ слов от протяженности словаря именных словосочетаний, исчисляемой в словах (получена по словарю словосочетаний объемом 34 182 слов) Зависимость объема словаря наименований понятий от объема массива элементарных сообщений в фактографической ИПС (получена по массиву объемом 17 690 сообщений) [c.266]

    Зависимость объема словаря словоформ и словаря основ слов от объема словаря наименований понятий (СНП) [c.270]

    Зависимость объема словаря наименований понятий от объема массива элементарных сообщений в фактографической ИПС [c.270]

    Б. Определение среднего значения коэффициента сжатия именных словосочетаний при переходе от их пословных кодов к порядковым номерам по словарю наименований понятий [c.275]

    Среднее значение коэффициента сжатия ксж при переходе от пословных кодов именных словосочетаний к их номерам по словарю наименований понятий определится как отношение величия h и h  [c.275]

    Объем словаря наименований понятий для перевода сообщений с русского языка на информационный, [c.277]

    Объем словаря наименований понятий для декодирования сообщений  [c.277]

    Словарь наименований понятий и классификационный словарь молено совместно использовать в двух режимах 1) в режиме однократного обращения к словарям 2) в режиме циклического поиска. В первом случае сначала производится поиск по словарю наименований понятий, а его результаты служат исходными данными для поиска в классификационном словаре. Во втором случае после однократного обращения к словарям из общего массива результатов поиска выделяются номера терминов, полученные при аоиске в классификационном словаре и отличающиеся от номеров терминов, найденных в словаре наименований понятий. Выделенные номера терминов с помощью словаря наименований понятий заменяют их пословными кодами и обращаются повторно сначала к словарю наименований понятий, затем к классифякационному словарю. Далее среди результатов поиска по классификационному словарю снова выделяют такие номера терминов, которые не были найдены на предыдущих этапах. Эти номера заменяются на пословные коды терминов н снова обращаются к словарям и т. д. Процесс циклического поиска продолжается до тех пор,, пока пе перестанут находиться новые номера терминов. [c.187]


    Для оценки эффективности различных способов автоматического установления смысловых связей между терминами автором совместно с Е. А. Загика и В. А. Чир-киным был поставлен эксперимент на ЭВМ. Для этого был использован ряд алгоритмов алгоритм точного морфологического анализа, алгоритм приближенного морфологического анализа, алгоритм поиска по словарю наименований понятий, алгоритм поиска по классификационному словарю понятий, алгоритм циклического поиска в классификационном словаре, алгоритм совместного циклического поиска в словаре наименований понятий и в классификационном словаре, алгоритм декодирования и оформления результатов поиска в словарях и др. [c.187]

    Были опробованы восемь способов установления смысловых связей между терминами 1) автономный поиск по словарю наименований понятий, построенному на основе приближенногй морфологического анализа 2) автономный поиск по словарю наименований понятий, по-188 [c.188]

    Полнота установления смысловых связей при поиске в словаре наименований понятий может быть существенно увеличена, если наряду с отношениями эквивалентности слов использовать родо-видовые отношения между ними. Если, например, известно, что понятия сортировка и кодирование являются видовыми по отношению к родовому понятию обработка , а понятие сообщение — видовьщ по отношению к понятию ин-192 [c.192]

    Поиск по словарю наименований понятий и в этом-случае целесообразно применять в комплексе с поиском по классификационному словарю. Сначала производится поиск по первому словарю, затем по второму. Новые номера понятий, найденные при поиске ПО классификационному словарю, заменяются на пословные коды словосочетаний, и эти коды используются для повторного поиска по словарю наименований понятий. Далее процесс поиска по обоим словарям повторяется до тех пор, пока не перестанут находиться иомера новых понятий -или пока не будет выпол-нено заданное число повторений. В заключение результаты, полученные на всех этапах, объединяются. [c.194]

    Эксперименты, проведенные автором совместно с Е. А. Зигика и В. А. Чиркиным, показали, что поиск по словарю наименований понятий с использованием смысловых связей слов в три раза эффективнее, чем поиск без использования этих связей. Уровень шумов при поиске понятий, эквивалентных по смыслу и подчиненных исходным, в среднем составляет 2%, а при поиске подчиняющих понятий—10%. Совместный циклический поиск по словарю наименований понятий и классификационному словарю с использованием смысловых связей слов позволяет выявить больше связей между словосо-чета Ниями, чем применение аналогичных процедур без использования связей слов-. При этом эквивалентных по смыслу и подчиненных понятий находится иа 17% больше, а подчиняющих понятий — на 12% больше. Уровень шумов при поиске эквивалентных по смыслу и подчиненных понятий возрастает до 20%, при поиске подчиняющих понятий — до 46%. [c.194]

    В словаре наименований понятий, предназначенном для декодирования информации, в словосочетаниях сохраняется естественный порядок слов. Слова здесь могут быть представлены номерами их основ, номерами словоформ или буквенными кодами словоформ. В первом и втором случае наряду со словарем словосочетаний необходимо иметь словарь слов (словарь основ слов или словарь словоформ соответственно). Словарь наименований понятий для декодирования информации составляется одновременно со словарем для ее кодирования. Он пополняется по мере появления новых терминов. Распознавание новых терминов производится с помощью словаря для кодирования информации, а в словарь для декодирования заносится по одному трансформационному варианту каждого термина. При составлении словарей наименований ронятий на ЭВМ с ограниченной емкостью оперативной памяти могут использоваться методы, рассмотренные ранее. [c.204]

    Перед началом функционирования системы составляется словарь основ слов и словарь наименований понятий, устанавливаются родо-видовые связи между понятиями (для классификационного словаря) и заполняются бланки сообщений (см. табл. 13.1). Родо-видовые связи фиксируются в классификационном словаре только в тех случаях, когда они не выражены в словесных формулировках наименований понятий. Слозарь основ [c.229]

    Дескринторные описания рефератов переносятся на перфоленту в международном телеграфном коде и вводятся в ЭВМ. Далее с помощью процедур морфологического анализа и отождествленрш наименований понятий исходные словосочетания заменяются на номера понятий по словарю. При необходимости словарь основ слов и словарь наименований понятий пополняются. В процессе формирования поисковых образов рефератов на печать выдается список новых наименований понятий вместе с их словарными номерами. Этот список служит в дальнейшем в качестве исходного материала для установления смысловых связей между наименованиями понятий и для пополнения классификационного словаря понятий. [c.240]

    Автоматическое индексирование документов по тек-.стам рефератов можно производить на основе той же методики, что и их поиск, но в качестве запроса здесь выступает весь словарь наименований понятий тезауруса. Термины словаря сопоставляются с текстом индексируемого реферата и, если они входят в одно из его предложений, заносятся в массив результатов. Процедура определения вхождений терминов тезауруса в текст реферата выполняется с по.мощью словаря смысловых связей слов. [c.262]

    Зависимость объема классификационного словаря понятий от объема словаря наименований понятий (получена по классификационному словарю, со-стаатенному для 11 635 наименований понятий и включающему 55 041 номеров понятий) [c.266]

    Пусть зависимость объема словаря наименований понятий у от количества формализованных сообщений х определяется выражением y=kiX а зависимость объема словаря основ слов z от объема, словаря наименований понятий у — выражением z= 2 l/" fei, ГИ], k2, ni2 — параметры). Тогда длина кода номера словосочетания будет /j = log2i/, а средняя длина пословных кодов словосочетаний (если слова кодируются номерами их основ) —/2 = i" p logzZ, где Гор — среднее количество слов в словосочетании. [c.275]


Смотреть страницы где упоминается термин Словарь наименований понятий: [c.186]    [c.189]    [c.189]    [c.204]    [c.256]    [c.275]   
Автоматизированные информационные системы (1973) -- [ c.164 , c.186 , c.202 , c.228 , c.256 , c.275 ]




ПОИСК







© 2025 chem21.info Реклама на сайте