Справочник химика 21

Химия и химическая технология

Статьи Рисунки Таблицы О сайте English

Словарь смысловых слов

    Отбор лексического материала является достаточно трудоемким процессом и обычно осуществляется следующим образом составляется словарь всех слов, представленных в выбранных источниках, и путем анализа и на основании особенностей данной области знаний производится отбор слов, которые в дальнейшем войдут в тезаурус. Часто для этих целей используются частотные словари словоформ, полученные в помощью ЭВМ е представительного массива текстовых источников по данной тематике. Полученные частотные и алфавитно-частотные списки словоформ вручную приводятся к соответствующим спискам слов, каждое из которых имеет показатель относительной частоты встречаемости в репрезентативной выборке текстовых источников, а значит, и в области функционирования проектируемой ИПС. Конечно, эти показатели дают грубую оценку полезности тех или иных слов, тем не менее их необходимо учитывать. Из полученного таким образом списка исключаются так называемые общеупотребительные слова, которые не несут смысловой нагрузки, — предлоги, союзы, наречия и др. Далее производится анализ каждого оставшегося слова и на основании его значимости решается вопрос о включении его в тезаурус. [c.12]


    Словарь основ слов состоит из двух частей — основного словаря и дополнительного. Основной словарь составляется до ввода системы в эксплуатацию и предназначен для точного морфологического анализа. Дополнительный словарь формируется в процессе эксплуатации системы и пополняется за счет новых слов. При этом используется процедура приближенного морфологического анализа. Основы новых слов записываются в словарь в порядке их поступления, а в качестве номеров смысловых эквивалентов используются их позиционные номера. Поиск в дополнительном словаре производится цепным способом. [c.235]

    Полнота установления смысловых связей между понятиями при индексировании может быть сушественно увеличена, если наряду со словарем основ слов и словарем наименований понятий использовать словарь родовидовых связей слов. При этом понятие А тезауруса может быть использовано для замены исходного понятия В, если для каждого слова наименования понятия А в наименовании понятия В находится либо эквивалентное ему по смыслу слово, либо слово, выражающее более узкое по объему понятие. В обоих наименованиях понятий схемы связей соответствующих слов должны совпадать. [c.257]

    Таким образом, чтобы перевести тексты рефератов и запросов в машинную форму представления и обеспечить высокий уровень полноты выдачи информации при поиске, необходим автоматический тезаурус. В состав тезауруса должны входить словарь основ слов, словарь смысловых связей слов, словарь наименований понятий и классификационный словарь понятий. [c.261]

    Машинный словарь основ слов представляет собой перечень буквенных кодов основ, упорядоченный по возрастанию их длины и по алфавиту. Каждая основа сопровождается цифровыми индексами, определяющими характер изменения форм слова в различных контекстных окружениях кроме того, каждой основе слова ставится в соответствие номер ее смыслового эквивалента. Номера смысловых эквивалентов обозначают классы эквивалентных слов, т. е. группы слов, способных замещать друг друга при трансформациях словосочетаний. [c.307]

    Слова (директивы), имеющие определенную смысловую нагрузку, хранятся в системных словарях и являются ключевыми, а все остальные слова предложения при обращении к системе выполняют роль комментариев и могут использоваться по усмотрению пользователя. Обычно применяются многоуровневые директивные языки, когда одной директиве высшего уровня приписываются в качестве параметров несколько различных по функциям директив нижнего уровня. Например, директиве Рассчитать можно поставить в качестве параметров директивы Реактор , Абсорбер , [c.150]


    Психологический эксперимент, кроме нахождения функций степеней принадлежности, позволяет выполнять классификацию терминов. Эта классификация дает возможность выявлять близкие по смысловому содержанию слова и словосочетания в пределах заданного словаря. Выявление близких по смыслу слов происходит в том случае, когда функции ц,- и) и (и) достигают максимальных значений при одном и том же значении аргумента. В этом случае полагают данные термины неразличимыми. [c.78]

    Включение в состав слова возвратной частицы влечет за собой изменение его синтаксической роли в предложении и обычно придает ему новый смысловой оттенок (сравни слова оборонять—обороняться , управляющий— управляющийся , пытал — пытался ). Естественно поэтому рассматривать возвратную частицу как- составную часть основы слова с внутренней флексией (с внутренним окончанием). Чтобы отличить основу слова с возвратной частицей от основы слова без возвратной частицы, к порядковому номеру основы, полученному по словарю, прибавляется некоторое постоянное число. Величина этого постоянного числа должна быть выбрана такой, чтобы результирующее число не совпадало ни с одним номером словарной основы. С этой целью в код номера основы слова можно ввести дополнительный разряд и отмечать цифрой 1 наличие признака возвратности. [c.112]

    При установлении смысловых связей с помощью словаря наименований понятий пословные коды терминов сопоставляются и проверяются на вхождение друг в друга. Два термина считаются связанными по смыслу, если совпадают коды их главных слов и все коды слов одного из терминов содержатся среди кодов слов другого термина. Если количество слов в обоих терминах одинаковое, то такие термины считаются эквивалентными по смыслу если разное, то более узким по смыслу считается термин, состоящий из большего количества слов. [c.186]

    Автоматическое установление смысловых связей между наименованиями понятий здесь можно реализовать следующим образом. Исходное словосочетание сначала кодируется пословно и для каждого слова по таблице родо-видовых отношений выбираются номера смысловых эквивалентов подчиненных ему слов, затем производится поиск по словарю наименований понятий. В процессе поиска отбираются номера словосочетаний, эквивалентных по смыслу исходному или подчиненных ему. При этом требуется выполнение двух условий  [c.193]

    Поиск наименований понятий, более широких по объему, чем исходные словосочетания, производится аналогичным образом, но перед обращением к словарю наименований понятий для каждого слова исходного словосочетания по таблице родо-видовых отношений выбирается перечень номеров смысловых эквивалентов подчиняющих слов. [c.194]

    Участие человека можно исключить, если применять приближенные методы кодирования наименований понятий, рассмотренные в гл. 9. Эти методы редко приводят к ложному отождествлению разных по смыслу понятий и они весьма просты в реализации. Резко упрощается и процедура автоматического составления словарей наименований понятий. Например, можно составлять словарь следующим образом. После пословного кодирования словосочетаний в их кодах на первое место ставится, номер главного слова, а все другие номера слов упорядочиваются по возрастанию их величины. Далее полученные коды сортируются с исключением повторений одинаковых элементов. При таком подходе автоматически учитываются трансформации с перестановками слов, а если в процессе пословного кодирования заменить номера основ слов на номера их смысловых эквивалентов, то будут учтены и трансформации с изменением основ слов. [c.203]

    В словаре родо-видовых связей слов фиксируются смысловые связи между словами, включенными в словарь основ. Для каждого слова указывается (если это возможно) перечень слов, выражающих более широкие понятия. Слова кодируются номерами смысловых эквивалентов их основ. [c.256]

    Эффективность различных способов автоматического установления смысловых связей между терминами оценивалась при двух вариантах пословного кодирования словосочетании. По первому варианту слова, основы которых содержались в основном словаре, были представлены номерами смысловых эквивалентов, а слова из дополнительного словаря — номерами основ. По второму варианту все слова были представлены номерами их основ, а словосочетания кодировались только с помощью приближенного морфологического анализа. Основной словарь основ слов отсутствовал, а дополнительный словарь имел объем 3675 элемектоз. [c.188]

    Дескринторные описания рефератов переносятся на перфоленту в международном телеграфном коде и вводятся в ЭВМ. Далее с помощью процедур морфологического анализа и отождествленрш наименований понятий исходные словосочетания заменяются на номера понятий по словарю. При необходимости словарь основ слов и словарь наименований понятий пополняются. В процессе формирования поисковых образов рефератов на печать выдается список новых наименований понятий вместе с их словарными номерами. Этот список служит в дальнейшем в качестве исходного материала для установления смысловых связей между наименованиями понятий и для пополнения классификационного словаря понятий. [c.240]

    Автоматическое индексирование документов по тек-.стам рефератов можно производить на основе той же методики, что и их поиск, но в качестве запроса здесь выступает весь словарь наименований понятий тезауруса. Термины словаря сопоставляются с текстом индексируемого реферата и, если они входят в одно из его предложений, заносятся в массив результатов. Процедура определения вхождений терминов тезауруса в текст реферата выполняется с по.мощью словаря смысловых связей слов. [c.262]


    Научное и бытовое словоупотребления часто не совпадают (мы это уже подчеркивали). Словарь русского языка под редакцией С. И. Ожегова (М. Русский язык, 1975) предлагает пять разных смысловых значений для прилагательного элементарный. Строго говоря, ни одно из них не соответствует тому значению, которое несет на себе слово элементарные в названии главы. Для контраста сравните два выражения элементарная математика и элементарные частицы. [c.204]

    Для осуществления индексирования, заключающегося в извлечении из текста необходимой информации, каждое из слов текста сравнивается со словарями системы, состоящими из словарей ключевых, неопределенных и несущественных (в рамках тематики СИАП) слов, а также словаря словосочетаний. Если в тексте были слова, которых нет ни в одном из словарей системы, то этИ слова передаются выходному, дис-летчеру (для печати). В результате работы блока автомати-,. ческого индексирования каждому документу ставится в соответствие индекс, состоящий из Д- и К-наборов , отображаю-,. хцих смысловое содержание документа. Д-наборы документов поступают йа хранение и переработку. [c.129]

    Полнота установления смысловых связей при поиске в словаре наименований понятий может быть существенно увеличена, если наряду с отношениями эквивалентности слов использовать родо-видовые отношения между ними. Если, например, известно, что понятия сортировка и кодирование являются видовыми по отношению к родовому понятию обработка , а понятие сообщение — видовьщ по отношению к понятию ин-192 [c.192]

    Эксперименты, проведенные автором совместно с Е. А. Зигика и В. А. Чиркиным, показали, что поиск по словарю наименований понятий с использованием смысловых связей слов в три раза эффективнее, чем поиск без использования этих связей. Уровень шумов при поиске понятий, эквивалентных по смыслу и подчиненных исходным, в среднем составляет 2%, а при поиске подчиняющих понятий—10%. Совместный циклический поиск по словарю наименований понятий и классификационному словарю с использованием смысловых связей слов позволяет выявить больше связей между словосо-чета Ниями, чем применение аналогичных процедур без использования связей слов-. При этом эквивалентных по смыслу и подчиненных понятий находится иа 17% больше, а подчиняющих понятий — на 12% больше. Уровень шумов при поиске эквивалентных по смыслу и подчиненных понятий возрастает до 20%, при поиске подчиняющих понятий — до 46%. [c.194]


Смотреть страницы где упоминается термин Словарь смысловых слов: [c.187]    [c.256]    [c.228]    [c.230]    [c.231]    [c.37]    [c.156]   
Молекулярная генетика (1974) -- [ c.187 ]




ПОИСК





Смотрите так же термины и статьи:

Слово



© 2024 chem21.info Реклама на сайте