Справочник химика 21

Химия и химическая технология

Статьи Рисунки Таблицы О сайте English

Составление словарей наименований понятий на ЭВМ

    Составление словарей Наименований понятий на ЭВМ [c.202]

    Составление словаря наименований понятий начинается с пословного кодирования исходного списка имен -ных словосочетаний. Затем производится синтаксический анализ, в результате которого каждое наименование понятия представляется в виде сочетания номеров основ и сопровождается номером грамматической структуры. При этом в сочетании номеров основ на первом месте ставится номер главного слова наименования понятия, а в структурной формуле главному слову и определяющим его прилагательным назначается информация име--нительный падеж единственного числа . Заключительным этапом составления словаря является сортировка кодов наименований понятий с исключением повторений одинаковых элементов. [c.202]


    Участие человека можно исключить, если применять приближенные методы кодирования наименований понятий, рассмотренные в гл. 9. Эти методы редко приводят к ложному отождествлению разных по смыслу понятий и они весьма просты в реализации. Резко упрощается и процедура автоматического составления словарей наименований понятий. Например, можно составлять словарь следующим образом. После пословного кодирования словосочетаний в их кодах на первое место ставится, номер главного слова, а все другие номера слов упорядочиваются по возрастанию их величины. Далее полученные коды сортируются с исключением повторений одинаковых элементов. При таком подходе автоматически учитываются трансформации с перестановками слов, а если в процессе пословного кодирования заменить номера основ слов на номера их смысловых эквивалентов, то будут учтены и трансформации с изменением основ слов. [c.203]

    Описанные процедуры автоматического составления словаря наименований понятий основаны на серийной обработке всего исходного списка словосочетаний. Они неудобны для пополнения словарей и для внесения в них изменений. Более удобными в этом отношении являются ассоциативно-адресные методы, и в частности узловой способ, описанный в гл. 5 и 6. Этот способ позволяет составлять словарь наименований понятий с нуля и вносить в него любые изменения. [c.203]

    Основной словарь основ слов (табл. 10.3) был составлен по неформализованным текстам и включал 4000 наиболее часто встречающихся основ. Дополнительный словарь составлялся по тезаурусу. Он содержал только такие основы слов, которые отсутствовали в основном словаре. Словарь наименований понятий (словарь пословных кодов терминов) формировался на основе словаря их побуквенных кодов. Последний использовался также для декодирования результатов поиска в словарях. [c.188]

    При работе автоматизированных ИПС широко используются словари различного наз.начения (словари словоформ, словари основ слов, словари наименований понятий). Составление словарей — задача весьма трудоемкая. Естественным поэтому является стремление автоматизировать этот процесс. Но если процесс составления словарей словоформ легко автоматизируется, то сложнее дело обстоит со словарями основ слов и словосочетаний. [c.195]

    Задача ставится следующим образом. Даны перечни наименований понятий (именных словосочетаний) в различной форме с повторениями одних и тех же элементов. Требуется отобрать из этих перечней разные по смыслу наименования понятий и представить их в форме, принятой для записи машинного словаря. Для решения этой задачи необходим машинный словарь основ слов, включающий все основы, которые могут встретиться в именных словосочетаниях. Такой словарь составляется заранее по описанной выше методике или формируется в процессе составления словаря именных словосочетаний. [c.202]


    В словаре наименований понятий, предназначенном для декодирования информации, в словосочетаниях сохраняется естественный порядок слов. Слова здесь могут быть представлены номерами их основ, номерами словоформ или буквенными кодами словоформ. В первом и втором случае наряду со словарем словосочетаний необходимо иметь словарь слов (словарь основ слов или словарь словоформ соответственно). Словарь наименований понятий для декодирования информации составляется одновременно со словарем для ее кодирования. Он пополняется по мере появления новых терминов. Распознавание новых терминов производится с помощью словаря для кодирования информации, а в словарь для декодирования заносится по одному трансформационному варианту каждого термина. При составлении словарей наименований ронятий на ЭВМ с ограниченной емкостью оперативной памяти могут использоваться методы, рассмотренные ранее. [c.204]


Смотреть страницы где упоминается термин Составление словарей наименований понятий на ЭВМ: [c.230]   
Смотреть главы в:

Автоматизированные информационные системы -> Составление словарей наименований понятий на ЭВМ




ПОИСК







© 2025 chem21.info Реклама на сайте