Справочник химика 21

Химия и химическая технология

Статьи Рисунки Таблицы О сайте English

Словарь ключевых слов

    СЛОВАРЬ КЛЮЧЕВЫХ СЛОВ [c.421]

    Словарь будет содержать более 3,5 тыс. ключевых слов >1 дескрипторов с английскими эквивалентами. Каждый дескриптор сопровождается кратким определением или толкованием. [c.43]

    Отдельные дескрипторы в словарях сгруппированы в тематические классы, состоящие из ключевых слов. Список ключе- [c.234]

    Пермутационные указатели обладают рядом недостатков. Во-первых, заглавие не всегда в должной мере отражает содержание документа. Во-вторых, в качестве самостоятельных рубрик используются только слова заголовка, а не термины, определенные из существа дела и специально разработанной рубрикации. Поэтому работы близкого содержания могут быть расположены под разными ключевыми словами, являющимися синонимами. Например, заголовки Выращивание кремния по методу Чохральского и Вытягивание кристаллов кремния из расплава имеют одинаковый смысл, но мало совпадающих ключевых слов и поэтому будут разнесены по несовпадающим рубрикам, в частности по рубрикам Выращивание и Вытягивание , хотя в полном контексте смысл этих слов совпадает. Поэтому каждый раз, изучая какую-либо тему, приходится вспоминать все слова-синонимы. Это особенно трудно, если указатель составлен на малознакомом языке. Безусловно, словарь синонимов очень полезен для такой работы. Подобные словари— так называемые тезаурусы — удобны для определения терминов, по которым выбираются ключевые слова для отыскания нужной информации в указателе. Примером такого справочника может служить [122]. [c.254]


    Особенно трудна задача выявления терминов, представляющих собой словосочетания. Обычно это именные словосочетания, например существительное с одним или несколькими прилагательными. Отбор этих ключевых слов, как правило, производится вручную из различного рода словарей, справочников и на основании знаний и опыта специалистов. В качестве человеко-машинного выявления используется (и то в редких случаях) способ, при котором с помощью ЭВМ вырабатываются частотные словари двоек , троек и т. д. смежных словоформ по текстам документов репрезентативной выборки. Отбор ключевых слов — словосочетаний из полученных списков производится вручную различными способами сопоставления, логических выводов, а также с использованием обычных дополнительных средств словарей, справочников, каталогов, консультаций со специалистами и т. д. Дальнейшее развитие методов автоматизации этого процесса ожидается при разработке процедур синтаксического и семантического анализа текстов, порождаемых русским естественным языком. Несмотря на имеющиеся многочисленные теоретические работы в этой области (в частности, связанные с проблемой машинного перевода с одного языка на другой), ощутимых практических результатов, к сожалению, не получено. Эти проблемы связаны не только о автоматизацией процесса разработки тезаурусов, но и с автоматизацией индексирования документов и запросов. [c.13]

    Большую степень упорядоченности представляет собой постатейный текст энциклопедий, справочников. Однако под БД обычно интуитивно понимают высоко упорядоченный набор данных так, что можно говорить о "формате" БД, т. е. о том, какая именно информация и в каких именно позициях строки записана на носителе. Часто БД является набором отдельных записей, каждая запись относится к одному объекту реального мира. Иногда запись (в особенности в библиографических БД) называют вторичным документом в отличие от первичных документов, в которых описываются реальные объекты. Разные стороны объектов описываются в разных разделах записи, называемых полями. Записи сопоставляется уникальное для данной БД слово - ее идентификатор. Объекты БД могут иметь различные признаки, по которым объекты можно классифицировать тем или иным способом. Ключом (ключевым словом) называется слово (обычно из заранее обусловленного словаря), сопоставленное классу объектов. Записи можно отыскать в БД по ключу или комбинации ключей. [c.223]

    Слова (директивы), имеющие определенную смысловую нагрузку, хранятся в системных словарях и являются ключевыми, а все остальные слова предложения при обращении к системе выполняют роль комментариев и могут использоваться по усмотрению пользователя. Обычно применяются многоуровневые директивные языки, когда одной директиве высшего уровня приписываются в качестве параметров несколько различных по функциям директив нижнего уровня. Например, директиве Рассчитать можно поставить в качестве параметров директивы Реактор , Абсорбер , [c.150]


    В словаре применяется американская транскрипция английских слов английская ( оксфордская ) транскрипция сопоставляется с американской лишь в основных или ключевых словарных статьях (см. пример к п. 8). [c.12]

    Пакет АСОД может формировать словарь DI TIONARY no текстам исходных документов, однако это приводит к засорению словаря ошибочно введенными терминами. По этой причине, а также для более эффективной индексации документов и запросов составлен словарь ключевых слов. Преи- 1лущества /применения словаря существенно возрастают по мере увеличения базы данных- В АСОД не предусмотрен режим ввода словаря, поэтому термины словаря расписаны в виде документов и введены в систему в режиме ввода доку- [c.214]

    В литературе на русском языке специалисты все более склоняются понимать под "банком данных" любую совокупность данных (в том числе и неструктурированных) об одной предметной области. Например, собрание оригинальных (необработанных специалистом) текстовых свидетельств очевидцев, наблюдатпих шаровую молнию, является банком данных (отметим, что эти свидетельства могут быть текстовыми файлами, хранящимися на магнитном носителе ЭВМ). Однако рассматривать это собрание как базу данных было бы не совсем точно, ибо "базой данных" специалисты все чапче называют совокупность данных, обладающих определенной структурой. Например, собрание каталожных карточек по журнальным публикациям с указанием автора н названия работы, издания, года вьшуска, тома, номера, страниц, ключевых слов является базой данных (отметим, что компьютерные каталоги в нашей стране пока редки). То, что информация в базе данных обладает структурой, позволяет алгоритмизировать ее обработку последнее обстоятельство обусловливает возможность автоматизации процедур работы с данными, что наиболее эффективно выполняет ЭВМ. О современной трактовке терминов "банк данных", "база данных" и связанных с ними понятий можно прочитать в словаре [Борковский, 1987] или в монографиях [Ульман,1983 Мартин,1980]. - Прим. ред. [c.610]

    Оговоримся, однако, что такая операция имеет смысл не всегда. Если базы данных, которые необходимо просмот-треть, имеют нрин-ципиально разное устройство или, например, при их подготовке для индексирования документов используют разные терминологические словари, то стратегия поиска, обеспечившая успех в одном случае, отнюдь не гарантирует его в другом. Однако если поиск идет, скажем, по текстам рефератов и/или ключевые слова при подготовке базы выбираются свободно, т. е. без привлечения терхминологиче-ских пособий, повторение успешно использованной стратегии поиска имеет очень большой смысл. Например, в системе ВИНИТИ е ее однородной совокупностью баз по различным областям знания этот прием можно использовать практически без ограничений и получить хорошие результаты. [c.43]

    Ключевые слова в рамках тематики СИАП образуют условные классы эквивалентности, называемые дескрипторами. Дескрипторы обозначаются числами. В результате сравнения текста введенного документа со входным словарем СИАП получается набор дескрипторов, поставленный в соответствие исходному документу. Эти наборы дескрипторов будем называть Д-наборами. [c.119]

    Каждое из оставшихся после исключения словосочетаний слов в предложении может быть либо несущественным, либо неопределенным, либо ключевым, что выясняется в результате сравнения со входным словарем СПАП. Если какая-нибудь, основа слова из входного словаря входит в рассматриваемую основу, то остаток (включая пустюй) сравнивается со списком окончаний слов естественного языка. В случае успеха принимается, что анализируемое слово есть во входном словаре, в противном случае оно рассматривается, как новое (неопределенное) слово. Во входном словаре основы слов размечаются по первым двум буквам и упорядочиваются по числу букв, в каждой основе. [c.122]

    В результате работы алгоритма выпечатывается словарь неопределенных слов для анализируемого документа (с. целью контроля) и его Д- и К-наборы. В Д-наборе при каждом дескрипторе указываются порядковые номера предложений, содержащих те основы ключевых слов, которым этот дескриптор поставлен в соответствие. [c.123]

    Для осуществления индексирования, заключающегося в извлечении из текста необходимой информации, каждое из слов текста сравнивается со словарями системы, состоящими из словарей ключевых, неопределенных и несущественных (в рамках тематики СИАП) слов, а также словаря словосочетаний. Если в тексте были слова, которых нет ни в одном из словарей системы, то этИ слова передаются выходному, дис-летчеру (для печати). В результате работы блока автомати-,. ческого индексирования каждому документу ставится в соответствие индекс, состоящий из Д- и К-наборов , отображаю-,. хцих смысловое содержание документа. Д-наборы документов поступают йа хранение и переработку. [c.129]

    Согласно толковому словарю Уэбстера, термин денатурация означает потерю первоначальных свойств. При таком определении данное слово несет огромную семантическую нагрузку. Козман [1091а] и Ву дали следующее уточнение этого определения, которое, впрочем, является скорее объяснением сущности процесса. Денатурация представляет собой нарушение структуры природных белков при разрыве стабилизирующих ее внутримолекулярных связей. Это определениесогласуется с более ранней интерпретацией Мирского и Полинга [1415], в которой они подчеркивают ключевую роль Н-связи в реакциях белков. Они рассмотрели поведение нативных и денатурированных белков и обсудили возможные различия в их молекулярной структуре. [c.276]


    В первом цикле работы алгоритма вх,одной словарь вводится пустым, а любое из вводидтых слов текста считается неопределенным. Если при неопределенном слове накопилась информация о том, что оно встретилось в заданном числе документов, то слово выпечатывается вместе с необходимой информацией для принятия решения, каким считать в дальнейшем это слово — ключевым или несущественным. Окончательное решение здесь принимает человек, так как формально отобразить семантическую роль того или иного слова в конкретном контексте пока не представляется возможным. [c.122]


Смотреть страницы где упоминается термин Словарь ключевых слов: [c.72]    [c.72]    [c.213]    [c.171]    [c.31]   
Смотреть главы в:

Основы построения операционных систем в химической технологии -> Словарь ключевых слов

Основы построения операционных систем в химической технологии -> Словарь ключевых слов




ПОИСК





Смотрите так же термины и статьи:

Слово



© 2025 chem21.info Реклама на сайте