Справочник химика 21

Химия и химическая технология

Статьи Рисунки Таблицы О сайте English

Словарь канонических форм слов

    Исходными данными для- синтаксического анализа служат результаты работы алгоритма отождествления слов. Если слова отождествляются с помощью словаря словоформ, то для каждого слова наименования понятия указывается номер канонической формы слова (по словарю словоформ), набор переменной грамматической информации (по табл. 7.3), соответствующий данной форме слова, и постоянная грамматическая информация. В качестве постоянной грамматической информации для существительных, прилагательных, предлогов, сочинительных союзов и наречий указывается признак принадлежности к соответствующему синтаксическому классу (С, П, Р, и Н). Кроме того, для существительных указывается признак рода, а для предлогов — перечни падежей, которыми они могут управлять. [c.167]


    Это разделение необходимо, чтобы обеспечить правильность морфологического анализа и синтеза слов. Индексы классов подстановок указываются в словаре для каждой канонической формы основы слов типа II. [c.119]

    Сочетание кода типа распределения и кода грамматической информации однозначно определяет необходимость введения в синтезируемое слово канонической или вариантной формы основы. Код типа распределения указывается в словаре для каждой канонической формы основы слова типа П1, наряду с индексом канонической формы и индексом варианта подстановки. Смысл индекса варианта подстановки для канонических форм основ определяется табл. 7.9, а для вариантных — табл. 7.8. [c.123]

    Одной из задач синтаксического анализа наименований понятий является приведение их кодов к канонической форме, в которой они хранятся в словаре. Это достигается путем назначения главному слову наименования понятия, и согласованным с ним прилагательным грамматической информации именительный падеж единственного числа , а также путем перестановок слов и групп слов, не искажающих смысла словосочетаний (путем трансформации словосочетаний). Возможность трансформаций наименований понятий определяется по их грамматической структуре и выполняется таким образом, чтобы переставляемые слова были упорядочены слева направо по возрастанию номеров, а группы слов — по возрастанию номеров их начальных слов. По окончании указанных операций главное слово словосочетания выносится на первое место. [c.166]

    Требования, предъявляемые к словарю наименований понятий в процессе кодирования и декодирования информации, противоречивы. В процессе кодирования решается задача распознавания терминов, и здесь требуется приводить трансформационные варианты словосочетаний к канонической форме. При этом может теряться информация о порядке следования и о Формах слов [c.203]

    К изменяемым основам слов типа П1 отнесены такие основы личных форм глаголов и глаголов прошедшего времени, у которых имеет место чередование согласных. Эти основы встречаются в двух формах, отличающихся друг от друга по буквенному составу. Обе формы основы включаются в словарь. Одна из них считается канонической, другая — вариантной. У личных форм глаголов в качестве канонической принята основа формы третьего лица единственного числа, у глаголов прошедшего времени — основа формы множественного числа. 120 [c.120]

    Синтез форм неизменяемых слов сводится к простой выборке из словаря буквенного состава их основ. В некоторых случаях к последнему приформировывается возвратная частица. Формы изменяемых слов составляются из буквенных кодов их основ и окончаний. В случае необходимости к основе слова приформировывается внутренний мягкий знак, а к окончанию—возвратная частица ся или сь . Кроме того, канонические формы основ типа П, П1, IV заменяются на вариантные. Необходимость замены канонической формы основы на вариантную определяется но номеру основы и oinpo-вождающей его грамматической информации. [c.104]


    Основы слов типа II представлены в словаре только в канонической форме. Эта форма основы встречается в словоформах с ненулевым окончанием, отличным от, мягкого знака. Вариантная форма основы бывает у словоформ с нулевым окончанием или с мягким знакохМ в качестве окончания (см., например, словоформы колодец и день ). При морфологическом анализе вариантная форма основы приводится к канонической путем за1мены соответствующей буквы на нуль или на другую букву (согласно табл. 7.6). [c.118]

    Формирование буквенного кода слова начинается с выборки из словаря буквенного кода его основы. Затем по табл. 7.10 определяется необходимость замены канонической формы основы на вариантную. Если такой необходимости нет, то к основе приформировывается окончание. Если замена необходима, то она производится с помощью табл. 7.9. [c.123]

    Табл. 7.11 иллюстрирует структуру словаря супплетивных основ слов. Во втором ее столбце перечислены буквенные коды канонических и вариантных форы основ слов, а в третьем столбце — отсылки, указывающие для каждого варианта основы соответствуюпхий ему порядковый номер канонической формы основы (согласно нумерации первого столбца). Буквенные коды канонических и вариантных фор М основ в табл. 7.11 записаны рядом сначала идет код канонической формы основы, а вслед за ним — код ее вариантной формы. Следует за- [c.124]

    Если слова отождествляются с помощью словаря основ, то для каждого слова наименования понятия указывается номер канонической формы основы, номер флективного класса и набор переменной грамматической информации. При это.м постоянная информация к словам определяется по номерам их флективных классов. Это оказывается возхтожным благодаря тому, что система классификации слов отражена в нумерации флективных классов (см. табл. 7.1). [c.167]

    Морфологический анализ и синтез слов производится с помощью словаря основ и ряда вспомогательных таблиц. В словарь включены основы простых и сложных слов без внутренней флексии. Для сложных слов с внутренней флексией типа слесарь-инструменталь-щик , завод-изготовитель и т. п. в словаре приведены лишь основы простых слов, входящих в состав этих сложных слов. Если слово имеет несколько форм основ, то в словарь, как правило, были включены все формы основ слов. Исключение составляют лишь изменяемые основы типа II (основы с чередованием гласных), которые представлены в словаре только в одной из возможных форм, принятой за каноническую. Каждой основе словаря ставится в соответствие сочетание кода основоизменительного класса и кода флективного класса, а омонимичной основе—серия сочетаний таких кодов. Фрагменты словаря основ слов приведены в приложении 2. [c.102]

    В процессе флективного анализа основа слова может не найтись в словаре. Это возможно в тех случаях, когда анализируемое слово имеет основу типа II в вариантной форме или является сложиым словом с внутренней флексией или когда основа анализируемого слова не представлена в словаре ни в канонической, ни в вариантной форме. До окончания флективного анализа слова обычно неизвестно, какой из трех перечисленных случаев имеет место. Вначале анализируемое слово проверяется на возможность наличия вариантной формы основы типа II. Если эта возможность вероятна, то вариантная форма основы заменяется на каноническую и проверяется правильность этой замены с помощью словаря ОСНОВ. При положительном результате проверки определяется номер основы и грамматической информации к слову. [c.103]


Автоматизированные информационные системы (1973) -- [ c.125 , c.127 ]




ПОИСК





Смотрите так же термины и статьи:

Канонический

Слово



© 2024 chem21.info Реклама на сайте