Справочник химика 21

Химия и химическая технология

Статьи Рисунки Таблицы О сайте English

Синтаксический анализ именных словосочетаний

    Синтаксический анализ именных словосочетаний [c.166]

    Особенно трудна задача выявления терминов, представляющих собой словосочетания. Обычно это именные словосочетания, например существительное с одним или несколькими прилагательными. Отбор этих ключевых слов, как правило, производится вручную из различного рода словарей, справочников и на основании знаний и опыта специалистов. В качестве человеко-машинного выявления используется (и то в редких случаях) способ, при котором с помощью ЭВМ вырабатываются частотные словари двоек , троек и т. д. смежных словоформ по текстам документов репрезентативной выборки. Отбор ключевых слов — словосочетаний из полученных списков производится вручную различными способами сопоставления, логических выводов, а также с использованием обычных дополнительных средств словарей, справочников, каталогов, консультаций со специалистами и т. д. Дальнейшее развитие методов автоматизации этого процесса ожидается при разработке процедур синтаксического и семантического анализа текстов, порождаемых русским естественным языком. Несмотря на имеющиеся многочисленные теоретические работы в этой области (в частности, связанные с проблемой машинного перевода с одного языка на другой), ощутимых практических результатов, к сожалению, не получено. Эти проблемы связаны не только о автоматизацией процесса разработки тезаурусов, но и с автоматизацией индексирования документов и запросов. [c.13]


    Составление словаря наименований понятий начинается с пословного кодирования исходного списка имен -ных словосочетаний. Затем производится синтаксический анализ, в результате которого каждое наименование понятия представляется в виде сочетания номеров основ и сопровождается номером грамматической структуры. При этом в сочетании номеров основ на первом месте ставится номер главного слова наименования понятия, а в структурной формуле главному слову и определяющим его прилагательным назначается информация име--нительный падеж единственного числа . Заключительным этапом составления словаря является сортировка кодов наименований понятий с исключением повторений одинаковых элементов. [c.202]

    Системы автоматического индексирования документов, ориентированные на использование преимущественно однословных терминов, проще в реализации, чем системы, в которых основными единицами речи считаются словосочетания. В этих системах словарь дескрипторов занимает меньший объем, чем в системах второго типа, в них легко выделяются из текста единицы речи (по пробелам между словами) и, как правило, не применяется синтаксический анализ. Но системы второго типа обеспечивают большую полноту поиска информации при меньшем уровне шумов. Полнота поиска увеличивается за счет использования парадигматических связей между словосочетаниями, а точность поиска — за счет синтагматических связей внутри словосочетаний. Кроме того, в системах второго типа в 2—3 раза сокращается объем массива поисковых образов документов по сравнению с объемом этого массива в системах первого типа (см. гл. ()). В дальнейшем мы будем рассматривать только такие способы автоматического индексирования, при которых в качестве основных единиц речи используют преимущественно именные словосочетания, а документы индексируют по текстам их рефератов. [c.255]


Смотреть страницы где упоминается термин Синтаксический анализ именных словосочетаний: [c.262]   
Смотреть главы в:

Автоматизированные информационные системы -> Синтаксический анализ именных словосочетаний


Автоматизированные информационные системы (1973) -- [ c.166 ]




ПОИСК







© 2025 chem21.info Реклама на сайте