Справочник химика 21

Химия и химическая технология

Статьи Рисунки Таблицы О сайте English

Грамматическая информация к словоформам

    В ИПС словари слов могут быть в виде словаря словоформ и в виде словаря основ слов. В первом случае основным элементом словаря является буквенный код словоформы, во втором — буквенный код основы слова. В процессе перевода сообщений с русского языка на информационный поиск в словаре осуществляется по буквенному коду словоформы или основы слова, а из словаря выбирается порядковый номер словоформы (основы слова) и сопровождающая его грамматическая информация. При переводе с информационного языка на русский из словаря по номеру словоформы или основы слова выбирается буквенный состав искомого элемента и его грамматическая информация (если она необходима). Первый вид поиска в словаре называется прямы м, а второй — обратным. В ИПС словарь должен быть построен так, чтобы он был удобен и для прямого и для обратного поиска. [c.87]


    Простейшей формой записи словаря в памяти машины является неупорядоченный список словоформ или основ слов, сопровождаемых номерами наборов грамматической информации. В этом случае в качестве номера слова можно использовать номер его позиции в списке. И прямой и обратный поиск по словарю здесь осуществляется последовательным просмотром всех его элементов. Последовательный просмотр всех элементов словаря при обратном поиске обусловлен тем, что слова имеют различную длину и могут записываться в различном числе ячеек памяти. [c.88]

    При автоматическом переводе текстовых сообщений с русского языка на информационный возникает задача отождествления различных форм одного и того же слова и получения к ним грамматической информации. Эта задача может быть выполнена как путем морфологического анализа слов, так и без него. В последнем случае в словаре необходимо хранить все (или наиболее часто встречающиеся) формы слов. Принципы автоматического отождествления слов и их синтез с помощью словаря словоформ описаны в работе [24] и здесь не рассматриваются. В настоящей главе и гл. 8 основное внимание уделяется способам автоматического морфологического анализа и синтеза слов. [c.95]

    ГРАММАТИЧЕСКАЯ ИНФОРМАЦИЯ К СЛОВОФОРМАМ (для изменяемых слов) [c.105]

    Исходными данными для- синтаксического анализа служат результаты работы алгоритма отождествления слов. Если слова отождествляются с помощью словаря словоформ, то для каждого слова наименования понятия указывается номер канонической формы слова (по словарю словоформ), набор переменной грамматической информации (по табл. 7.3), соответствующий данной форме слова, и постоянная грамматическая информация. В качестве постоянной грамматической информации для существительных, прилагательных, предлогов, сочинительных союзов и наречий указывается признак принадлежности к соответствующему синтаксическому классу (С, П, Р, и Н). Кроме того, для существительных указывается признак рода, а для предлогов — перечни падежей, которыми они могут управлять. [c.167]

    Появление новых слов в тексте может помешать правильному выполнению его синтаксического анализа. Между тем для выявления синтаксической структуры фразы в большинстве случаев достаточно получить информацию о принадлежности незнакомого слова только к определенному грамматическому классу и не требуется более подробных сведений форме слова. Возникает вопрос, нельзя ли, не прибегая к помощи словаря, определять грамматический класс слова по его буквенному составу Задача подобного рода была поставлена и решена автором совместно с И. М. Давыдовой. В процессе исследования был проанал изирован обратный словарь словоформ объемом около 30 ООО единиц, составленный по деловым текстам протяженностью 500 ООО слов (см. приложение 3). В результате были построены распределения частот появления грамматических классов, ассоциированных с различными буквами и буквосочетаниями, стоящими в конце слова. Фрагмент перечня распределений частот появления грамматических классов приведен в табл. 8.1. [c.138]


    Понятия автоматически кодируются с помощью двух словарей словаря слов и словаря понятий. Словарь слов может быть оформлен в виде словаря словоформ или словаря основ слов. Все его элементы нумеруются. Словарь понятий содержит список свернутых кодов именных словосочетаний, используемых в информационной системе. Каждое наименование понятия представлено в словаре сочетанием нхзмеров слов , входящих в его состав, и номером грамматической структуры. Грамматическая структура словосочетания содержит информацию о связях между словами и информацию о формах слов, необходимую при декодировании. Различные грамматические структуры задаются списком. [c.164]

    Подобно процессу кодирования наименований понятий их декодирование также осуществляется в три этапа. Сначала по номеру понятия из словаря выбираются соответствующие ему сочетание номеров слов и номер грамматической структуры. Затем из сшиска грамматических структур извлекается информация о формах слов и о их связях, а также корректируется порядок слов в словосочетании (номер главного слова ставится после номеров определяющих его прилагательных). На заключительном этапе формируются буквенные коды словоформ (см. гл. 7, 8). [c.174]


Автоматизированные информационные системы (1973) -- [ c.105 ]




ПОИСК





Смотрите так же термины и статьи:

Информация



© 2025 chem21.info Реклама на сайте