Справочник химика 21

Химия и химическая технология

Статьи Рисунки Таблицы О сайте English

Поатомный поиск

    По такой таблице можно восстановить структуру соединения для поатомного поиска, установить размер цикла и номера входящих в него атомов. [c.139]

    Для того чтобы отчетливо проиллюстрировать основные характерные черты алгоритма поатомного поиска, мы преднамеренно не касались приемов, позволяющих уменьшить число вариантов при переборе вершин. На рис. 57 приведена диаграмма, иллюстрирующая движение от верши- [c.150]


    Поатомный поиск используется в случаях, когда первые два уровня фильтрации не смогли обеспечить однозначности ответа (например, нри выборе среди позиционных изомеров). [c.167]

    Что касается линейных (крупноблочных) входных кодов, то необходимо четко различать две стороны вопроса их использования в качестве кодов хранения и поиска. С одной стороны, действительно существует ряд задач, для решения которых целесообразно применение машинных поатомных матриц связи. В этом смысле нельзя говорить, что каноничная крупноблочная линейная запись полностью и во всех случаях заменяет каноничную матрицу связи, являющуюся характеристикой структурной формулы на языке универсального типа. С другой стороны, крупноблочные формы записи имеют ряд преимуществ перед громоздкими записями матричного тина. [c.92]

    В зависимости от языка поиска алгоритмы поиска можпо разделить на два класса алгоритмы поиска по поатомным матрицам связи алгоритмы поиска по линейным записям. [c.147]

    Используются следующие три основные метода поиска по химическим файлам а) поиск по фрагментным кодам, которые заранее генерируются специальной программой и постоянно хранятся в отдельном файле б) поиск комбинаций символов в ЛСО и (или) других параметров, например молекулярной формулы в) поатомный поиск таблицы связи, генерируемой в момент начала поиска. Принцип, положенный в основу такой организации поиска, состоит в том, что каждый уровень поиска может действовать как сито, так что последующий поиск ведется лишь среди соединений, отобранных на предыдущем уровне. Для реализации поиска этими методами в системе ROSSBOW для каждого соединения должны храниться следующие данные 1) ЛСО 2) фрагментный код, охватывающий 152 возможных фрагмента и хранящийся в виде 152-битового двоичного слова 3) молекулярные формулы длиной в 3— 18 символов. [c.450]

    Поиск по комбинациям символов происходит медленнее, чем поиск по фрагментам, но часто дает исчерпывающий ответ. Третий уровень — поатомный поиск — является длительным процессом, поскольку он включает генерирование таблицы связей (36, 33] для молекулы и последующий подробный поиск по всей базе данных. Поатомный поиск задается как поиск некоторого набора узлов, соединенных друг с другом определенным образом. Этот тип поиска используется в тех случаях, если запрос требует поиска соединений, содержащих определенные типы атомов, связанных определенным образом. Поскольку такие методы поиска обычно требуют много времени, довольно часто путем предварительной отбраковки число подлежащих обработке структур сводится до минимума (два рассмотренных выше метода поиска могут служить примерами подобных методик). Все методы, используемые в системе ROSSBOW, подробно описаны Б литературе [36—38]. [c.452]


    Выше указывалось, что основным достоинством алгоритма поатомного поиска является возможность поиска произвольных подструктур. Различные аспекты машинного поиска структур по поатомным матрицам исследовались в hemi al Abstra ts Servi e. [c.151]

    В большинстве случаев предварительный поиск по такого рода запросам можно начинать по одному из упомянутых трех поисковых массивов, построенных по кодам скелетных схем, которые используются в качестве фильтровой информации. Далее, внутри сравнительно небольшого числа групп или подгрупп реакций, скелетные схемы которых не противоречат условиям запроса, продолжается поатомный поиск непосредственно по полным линейным кодам совмещенных структурных уравнений конкретных реакций. В случае запросов, выражаемых наиболее общего вида структурными особенностями , может оказаться целесообразным проводить предварительный поиск не по скелетным схемам, а по дескрипторным поисковым образам структурных уравнений реакций. С этой целью необходимо выработать автоматически еще одип фильтровый поисковый массив реакц1 й, в котором в качестве дескрипторов должны использоваться отдельные виды изменяющихся связей и характеристики изменения циклов. Наряду с такими структурными дескрипторами реакций в этом поисковом массиве целесообразно отразить с помощью других дескрипторов также главные особенности условий проведения реакций, применяемые реагенты, катализаторы и другие неструктурные виды информации о реакциях. Это позволит проводить соответствующие виды поисков по запросам неструктурного или смешанного характера. Использование в дескрипторном фильтровом поисковом массиве реакций структурных дескрипторов, характеризующих особенности строения исходных или конечных соединений, не представляется целесообразным, Соответствующие поиски могут проводиться в подсистеме соединений с последующим переходом от соединений к реакциям с помощью имеющихся при соединениях отсылок на регистрационные номера реакций. Когда структурные условия на соединения, участвующие в реакции, лишь дополняют более сильные условия на структурный тип реакции, то проверка структурных особенностей соединений может проводиться непосредственно по структурным уравнениям конкретных реакций. [c.235]

    Основу системы ХИМИНФОРМ составляет Регистрационная система химических соединений, обеспечивающая идентификацию и регистрацию всех вводимых в систему структур. Каждое соединение представляется в Регистрационной системе топологической (поатомной) записью и регистрационным номером, по которому осуществляется пополнение массивов системы сведениями о данном веществе, В конце 1985 г. Регистрационная система содержала 1,2 млн структур и около 5 млн записей об их свойствах, реакциях и областях применения. Выходными данными системы являются машиночитаемая база структурных данных (СД) и специализированные указатели. База СД — это крупнейшая документально-фактографическая база данных в рамках стран — членов СЭВ. Она содержит библиографическое описание документа, номер реферата в РЖХим и для каждого соединения — его регистрационный номер, брутто-формулу, названия (систематическое и тривиальное), важнейшие структурные фрагменты и otoбeннo ти структуры, записанные на формализованном языке (структурные и синтаксические термы), вырабатываемые из поатомной записи соединения, сведения о свойствах, реакциях и областях применения, также представленные с помощью формализованного языка (предметные термы). База СД обеспечивает поиск индивидуальных соединений и классов соединений, а также сведений о них по всем элементам данных, входящих в базу, и их сочетаниям. [c.68]

    В обзоре Г. Э. Влэдуца и соавторов [27] предлагается кодовые языки, применяемые для описания структур химических соединений, делить в соответствии с их использованием в информационно-поисковых системах на три группы 1) языки для ввода, 2) для поиска и 3) для хранения информации. При анализе различных способов кодирования структурной информации авторы используют такие их характеристики, как полнота, по-атомность и каноничность. По мнению авторов, наличие нескольких специализированных (ввод, поиск и т. д.) форм записей структуры не должно вызвать трудностей, так как универсальные ЭВМ уже сегодня с успехом осуществляют перевод одного кода в другой. Этот факт заставляет, признать наиболее удобным языком — простой поатомный язык топологического описания структурных формул. [c.27]

    Для выполнения требования универсальности необходимо иметь в ИПС запись каждой структуры в виде варианта матрицы связи, в которой перечисляются все атомы структурной формулы и связи между атомами. Различные варианты подобных матриц разобраны нами в гл. 4. Одпако подобным поатомным матрицам присущ существенный недостаток поиск по ним сложен. Как известно, объектом внимания химика, носителем физических, биологических, химических и других свойств является не отдельный атом, а совокупность атомов. Необходимо уметь быстро идентифицировать в ЭВМ химически значимые фрагменты. Иными словами, машинная запись структурной формулы должна обладать свойством, обеспечивающим легкость алгоритмического нахоледения химически значимых групп. Целый ряд исследований показал, что поиск химических соединений по структурным признакам исключительно и неносредственно только по поатомпым записям нецелесообразен. [c.117]


    Первая и вторая функция дополнительных кодов могут быть совмещены. При использовании дополнительных кодов в качестве фильтровой информации в автоматизированной информационной системе одновременно хранятся массив фильтров структурных формул (первый уровень системы) и массив полной записи структурных формул, папример, в виде матриц связи (второй уровень системы). При информационном поиске вначале генерируется фильтровая информация, соответствующая запросу. Затем фильтровый образ запроса сравнивается с помощью простого алгоритма с фильтром очередного рассматриваемого соединения. В большинстве случаев уже на первом уровне h tbmj, удается исключить из дальнейшего рассмотрения соединения, не удовлетворяющие запросу. При этом в большинстве случаев удается избежать работы на втором уровне системы, связанной с использованием сложного алгоритма поатомного анализа записей соединений, что и дает значительный выигрыш во времени. Исследования, проведенные в ВИНИТИ [781, показали, что системы фильтровой информации могут быть использованы пе только для умепьшеиия числа обращений к поатомным записям химических соединеиий (т. е. именно в качестве фильтра ), но так ке и как языки самостоятельных частных ИПС для органических соедииеинй, так как содержат информацию о большом числе фрагментов. [c.119]

    Был составлен и реализован алгоритм выработки бинарных структур ных признаков из поатомных машинных матриц. В этом случае автоматическое индексирование сводится к специализировапному варианту автоматического поиска вхождения подграфа в химический граф. Этот вариант автоматического поиска отличается от обычного тем , что устанавливаются определенные отношения между признаками, что позволяет сократить время индексирования за счет совмещения поиска по нескольким структурным признакам. Результат записывался при этом в виде набора номеров признаков. [c.120]


Смотреть страницы где упоминается термин Поатомный поиск: [c.54]    [c.56]    [c.148]    [c.148]    [c.151]    [c.167]    [c.248]    [c.142]    [c.93]    [c.148]    [c.184]    [c.207]   
Компьютеры в аналитической химии (1987) -- [ c.450 ]




ПОИСК





Смотрите так же термины и статьи:

Шаг поиска



© 2025 chem21.info Реклама на сайте