Справочник химика 21

Химия и химическая технология

Статьи Рисунки Таблицы О сайте English

Индексирование структурных формул

    АВТОМАТИЧЕСКОЕ ИНДЕКСИРОВАНИЕ СТРУКТУРНЫХ ФОРМУЛ ОРГАНИЧЕСКИХ СОЕДИНЕНИЙ [c.117]

    Хотя процедурный аспект автоматического индексирования структурных формул может с некоторыми оговорками считаться автономным , эффективность выбранной системы фильтров может быть оценена, как правило, только в рамках алгоритма поиска семейств родственных соединений. Именно исходя из этого факта, мы рассматриваем автоматизированную систему с использованием фильтров на основе механического химического кода . [c.162]


    Говоря об индексировании, автор имеет в виду необходимость иметь для этих целей название, не только однозначно передающее структурную формулу, но и записываемое в строго определенном порядке. Только выполнение последнего требования дает возможность уверенно находить соединение в алфавитных указателях, энциклопедиях. [c.46]

    Автоматизированная информационная система для химии должна решать широкий круг задач, в числе которых важное место занимают корреляционные задачи. В зависимости от типа искомых корреляций (например, инфракрасный спектр — структура , ультрафиолетовый спектр — структура , биологическая активность — структура ) требуется свой специфический подход к структурной формуле и, возможно, свой способ фрагментации. От задачи к задаче меняется и требуемая глубина индексирования. Это связа 10 с тем, что значимые фрагменты для различных корреляционных задач будут различны. В этой ситуации автоматическое индексирование является удобным средством для соответствующего представления структурной формулы как набора потенциально значимых фрагментов . Отсюда ясно, как тесно связана проблема автоматического индексирования с проблемой формализации понятия структурной родственности, рассматриваемой в гл. VII. [c.119]

    Другой путь повышения адаптивности заключается в двухуровневой организации, охватываюш,ей с единой методологической точки зрения любой структурно-химический объект информационной системы. В этом случае с помощью алгоритмов автоматического индексирования для каждой структурной формулы генерируется вторичная дополнительная запись, приспособленная к массовым структурно-химическим задачам. В гл. IV подобные вторичные записи были названы дополнительными кодами . Таким образом, алгоритмы автоматического индексирования являются средством повышения адаптивности при сохранении универсальности автоматизированных информационных систем. Задача автоматического индексирования структурных формул органических соединений есть частный случай более общей проблемы автоматического индексирования текстов. Касаясь этой общности, Кент [77] отмечал, что и в том и в другом случае цель индексирования заключается в выделении признаков, пригодных для информационного поиска. В связи с этим небезынтересно отметить, что сотрудник фирмы IBM Лун, известный своими работами в области автоматического индексирования текстов, разработал также систему кодировапия ациклических цепей (в частности, структурных формул органических соединений), основанную на учете статистического распределения узлов в структурной формуле. [c.118]


    Существуют два основных варианта автоматического индексирования структурных формул. Первый вариант сводится к обычному координатному индексированию. Задается некоторый словарь значимых структурных признаков S = Si, Sa,. .., Sk . Далее алгоритм по соответствующей полной записи структурной формулы (например, по матрице связи) ставит в соответствие каждой структуре некоторое подмножество признаков S = == . Зр, St,. .. из этого с.товаря. В этом случае дополнительная запись имеет вид набора чисел, например 17 56 105 264, что означает, что данная структура содержит 17-й, 5б-й, 105-й и 264-й признаки из словаря структурных признаков. При втором варианте задается не словарь признаков, а правило генерации фрагментов структурной формулы. Другими словами, задаются отношения между исходной структурной формулой и некоторым к.лассом фрагментов. [c.118]

    Правило генерации может, например, предусматривать компактную запись, включающую кольцевую систему и ациклические фрагменты. В этом случае заранее может быть известен лишь общий класс фрагментов, которые будут выработаны алгоритмом. В соответствии с заранее сформулированными правилами алгоритм будет вырабатывать различные фрагменты, не будучи ограничен заранее их списком. Возможны и промежуточные варианты. При этом вовсе не обязательно, чтобы генерируемая запись включала именно фрагменты данной структурной формулы. Возможно алгоритмически вырабатывать дополнительную запись, свидетельствующую о принадлежности данной структуры к тому или иному общему классу соединений или же словесные наименования, характеризующие класс соединения, и т. д. В случае дескрипторных систем можно вводить отношения между дескрипторами и соответственно получать при автоматическом индексировании более репрезентативную характеристику структуры. Однако в последнем случае сложность системы возрастает. Итак, под автоматическим индексированием структурных формул понимается алгоритмически реализуемая процедура, ставящая в соответствие машинному коду структуры дополнительную запись, отображающую те или иные структурные особенности рассматриваемого соединения. [c.118]

    В заключении отметим, что проблема автоматического индексирования структурных формул исследована недостаточно. Наиболее многообеш аю-щими являются алгоритмы автоматического индексирования с переменным к.тассификациопным критерием. Эффективные способы индексирования должны основываться на такой формализации понятия структурной родственности, которая, будучи адекватной химическим реалиям, допускала бы в то же время достаточно технологическую схему автоматического индексирования структурных формул. [c.125]

    Прогресс науки зависит от обмена фактами и идеями. Огромное число, сложность и многообразие органических соединений придают проблеме номенклатуры первостепенное значение. В идеале каждое органическое соединение должно иметь систематическое название, которое позволяло бы написать для этого соединения только одну структурную формулу, в ряде современных систем номенклатуры этот идеал почти достигнут, что позволяет составлять очень полезные указатели для обширных сводок фактических данных по органическим соединениям. К сожалению, истинно систематическая номенклатура, по-видимому, непригодна для целей устного общения или повседневного написания, и обычно, за исключением случаев строгого каталогизирования и индексирования, используется смесь тривиальных и полусистематических названий. Искоренение нежелательных или устаревших систем номенклатуры является необычайно трудным делом, и для того, чтобы читать или разговаривать в области органической химии, необходимо быть знакомым с различны., системами номенклатур. Насколько это [c.36]

    Прогресс науки зависит от обмена фактами и идеями. Огромное число, сложность и многообразие органических соединений придают проблеме номенклатуры первостепенное значение. В идеале каждое органическое соединение должно иметь систематическое название, которое позволяло бы написать для этого соединения только одну структурную формулу. В ряде современных систем номенклатуры этот идеал почти достигнут, что позволяет составлять очень полезные указатели для обширных сводок фактических данных по органическим соединениям. К сожалению, истинно систематическая номенклатура, по-видимому, непригодна для целей устного общения или повседневного написания и обычно, за исключением случаев строгого к81талогизирования и индексирования, используется смесь тривиальных и полусистематических названий. Искоренение нежелательных или устаревших систем номенклатуры является необычайно трудным делом, и для того чтобы читать или разговаривать в области органической химии, необходимо быть знакомым с различными системами номенклатур. Насколько это возможно, следует избегать названий, вовсе не соответствующих структуре. Однако очевидно, что это не всегда оправдано, поскольку название, наиболее хорошо соответствующее структуре, может оказаться очень громоздким. Нетрудно видеть, что 9-(2,6,6-триметилциклогексен-1-ил)-3,7-ди-метилнонатетраен-2,4,6,8-ол-1 проигрывает в фонетическом отношении при сравнении с обиходным названием витамин А. [c.30]

    Рассматриваемая система предназначалась для специализированной ИПС для класса соедипений с сопряженными связями, что оказало влияние на выбор дескрипторов. Было выбрано пять классов дескрипторов В — характеристика циклической разветвленности структурной формулы В — размер кольца В,—состав циклической системы В — число колец в циклической системе В," — состав заместителей. В рассматриваемой системе т -= 2 -н 15, т. е. каждый класс дескрипторов содержит от 2 до 15 отдельных дескрипторов. Автоматическое индексирование проводилось непосредствеппо по входным кодам структурных формул. В подобных случаях особое значение приобретает технологичность машинной расшифровки входных кодов. Это определяется том, насколько явно в коде отображена организация исходного графического изображения структурной формулы — скелет циклической системы, гетероатомы, заместители, связки и т. д. [c.123]



Смотреть страницы где упоминается термин Индексирование структурных формул: [c.30]    [c.125]   
Автоматизированные информационные системы для химии (1973) -- [ c.117 ]




ПОИСК





Смотрите так же термины и статьи:

Структурные формулы



© 2025 chem21.info Реклама на сайте