Справочник химика 21

Химия и химическая технология

Статьи Рисунки Таблицы О сайте English

Инвертированные файлы

    Система поиска масс-спектров, описанная Геллером [4, 85—87], является диалоговой поисковой системой, основанной на инвертированном файле интенсивностей пиков. Программа обеспечивает широкий выбор воз.можностей поиска, например поиск по массовым числам и интенсивностям поиск значения молекулярной массы  [c.281]

    Итак, основой систем рассматриваемого типа является индекс. Он позволяет отвечать на каждый индивидуальный запрос настолько быстро, что становится возможной работа в режиме диалога. Поэтому слова системы с инвертированными файлами и диалоговые информационно-поисковые системы часто-употребляются как синонимы. [c.31]


    Инвертированный файл — это средство перебора отсылок к документам. Его называют инвертированным, т. е. переставленным, вывернутым, потому что он получается из текстов рассыпанием их на слова и упорядочением слов по алфавиту. Сами -слова, как мы уже говорили, хранятся в индексе инвертированный файл в узком смысле — это адресная книга по всем документам системы. Записи в ней, связанные с записями индекса, включают всю информацию, необходимую для работы со словами при поиске номер документа, из которого слово взято, номер или имя поля (заглавие, реферата и т. п.), номер предложения и сведения о положении слова в этом предложении (позднее мы покажем, как используется эта информация). [c.32]

    Еще о структуре данных. Прежде чем перейти к поисковым операциям, полезно еще раз остановиться на представлении данных в поисковых системах с инвертированными файлами, т. е. на их собственной точке зрения на информацию, с которой работает пользователь и которую они ему предоставляют. [c.36]

    В предыдущей главе были рассмотрены универсальные методы и средства диалогового поиска информации, которые, образно говоря, автоматизировали работу с реферативными журналами за счет построения гигантских указателей — инвертированных файлов. Поскольку к моменту появления таких средств были созданы и технология электронной подготовки информационных изданий, позволившая экономично вводить информацию в системы подобного рода, и технология телекоммуникаций, обеспечившая им широкий круг пользователей, системы с инвертированными файлами быстро получили широкое распространение. Однако довольно скоро выяснилось, что при поиске химической информации универсальные схемы работают далеко не так хорошо, как хотелось бы. [c.44]

    Таким образом, из всех возможных способов описания химических структур использование названий соединений и их фрагментов с учетом контекста лучше всего соответствует стандартной схеме поиска, основанной на инвертированных файлах. При этом возникают проблемы, связанные с упорядочением номенклатуры если она не была обеспечена при создании базы данных, пользователь должен включать в запрос все возможные варианты фрагментов, их сочетаний и расположения в пределах названия. Поскольку даже поиск по канонизированной номенклатуре не гарантирует 100%-ного успеха для всех видов структурных признаков, естественно было стремление создать методы поиска, которые были бы свободны от таких недостатков. [c.47]

    STN работает с текстовыми базами с помощью инвертированных файлов и предоставляет все возможности, являющиеся стандартными в этом случае. [c.120]

    Таким образом, в интервале 1 - 10 А, наиболее важном для идентификации, ad меняется примерно на два порядка, а АН остается практически постоянной. Это в значительной степени объясняет целесообразность сопоставления при автоматическом фазовом анализе не с[,а И, Сопоставление Q неудобно, если рентгенограммы снимались на разном излучении, хотя в некоторых программах сопоставляются в или J (О). При сопоставлении Н можно задать постоянное значение 6 (для данных, полученных на дифрактометре, оно равно примерно 1 10 A ). Значения Н округляются до целых чисел. Ошибка, вносимая округлением, немного меньше б, поэтому в случае необходимости можно использовать Н = / d (если экспериментальные данные получены с большей точностью, чем принимались нами, т.е. Ав < 0,05 ) или пользоваться Н = ЮЗ/д на стадии предварительного отбора. При сопоставлении данных для образца (// ) и стандарта ( =) совпадающими считаются значения //, различающиеся не боле5е чем на АН = 36 (при Ав = 0,05° ЛН = 3), т.е. Н° -AH hf //° + АН Окно совпадения АН может быть задано исследователем. Набор величин Н называется инвертированным файлом, минимальное и максимальное значение [c.48]


    Основные недостатки режима ИРИ и поисковых систем, -обеспечивающих этот режим информационного обслуживания иоиск ограничен узкими временными рамками, а процесс уточнения запроса происходит без непосредственного участия наиболее авторитетного и заинтересованного лица — его автора. Системы, в которых эти недостатки до известной степени преодолеваются, были разработаны несколько позднее и ориентировались на другие, более мощные вычислительные машины. Это так называемые системы с инвертированными файлами, обеспечивающие быстрый поиск и активное взаимодействие с пользователем при обработке формулировки запроса, которые обычно действуют в режиме теледоступа. Поскольку такие системы занимают значительное место в современной практике информационного обслуживания, а возможности некоторых из них обсуждаются ниже, имеет смысл кратко остановиться на принципах работы подобных систем. [c.30]

    AS Online использует необычную структуру поисковых файлов. Еще в начале разработки системы (конец 1970-х гг.) специалисты AS пришли к выводу, что применение инвертированных файлов не является наилучшим решением при работе с описаниями химических структур. В качестве основной причины выдвигалось неприемлемое время реакции в диалоге при поиске по часто встречающимся фрагментам. Вероятно, не менее весомыми были другие соображения поскольку в AS Online логично было максимально использовать средства регистрационной системы, те и другие должны были быть ориентированы на частое (в пределе — постоянное) пополнение базы данных, при котором время реакции системы не должно существенно увеличиваться. Разработанное AS решение опирается на современные идеи параллельной и конвейерной обработки данных. Оно предусматривает разделение структурной базы [c.55]


Смотреть страницы где упоминается термин Инвертированные файлы: [c.52]    [c.53]    [c.308]    [c.214]    [c.50]    [c.52]   
Смотреть главы в:

ЭВМ помогает химии -> Инвертированные файлы




ПОИСК





Смотрите так же термины и статьи:

Файл



© 2025 chem21.info Реклама на сайте