Справочник химика 21

Химия и химическая технология

Статьи Рисунки Таблицы О сайте English

Коды структурных формул

    АВТОМАТИЧЕСКАЯ КАНОНИЗАЦИЯ КОДОВ СТРУКТУРНЫХ ФОРМУЛ [c.103]

    Истинные коды с выхода селектора ошибок поступают в процессор 4 — блок генерации промежуточной машинной записи. Коды с выхода блока кодирования, как правило, недостаточно приспособлены для машинной обработки. Функция описываемого блока — преобразование входных кодов структурных формул в машинные коды, в высокой степени приспособ- [c.41]


    Отдельные блоки могут быть совмещены, у них могут быть и другие функции, не указанные выше. Кроме того, в данной блок-схеме, как уже подчеркивалось, не указаны связи данной структурной подсистемы АИС с подсистемой поиска и обработки неструктурной информации. Условно можно считать, что структурная подсистема выдает номера соединений и коды структурных формул, соответствующих запросу. В памяти ЭВМ под этими номерами хранится вся информация о данном соединении. Выяснив номер запрашиваемого соединения или номера соединений требуемого семейства, ИПС может вывести на печать всю информацию, хранящуюся в памяти под этими номерами. [c.43]

    Среди органических соединений целесообразно выделить однородные п большие классы структур, отличающиеся специфическими чертами, хотя, возможно, и перекрывающиеся между собой и не исчерпывающие в сумме все множество органических соединений (например, класс циклических соедипений с сопряженными связями, класс соединений с большой ациклической частью, металлорганические соединения). Далее следует разработать ИПЯ универсального назначения (например, для всего множества органических соединений — поатомный код структурных формул) и различные специализированные ИПЯ, разработанные для каждого выделенного класса с полным учетом его специфики при соблюдении, однако, возможности алгоритмического перевода с каждого специализированного ИПЯ на универсальный ИПЯ. [c.46]

    Фотоэлектрические считывающие устройства фиксируют координаты атомов и связи между ними на некоторой координатной сетке. Код структурной формулы представляет собой таблицу с перечислением номеров узлов этой сетки, которым соответствуют атомы кодируемой структуры. Ниже иллюстрируется подобная координатная сетка и соответствующая ей таблица [35]. [c.55]

    Классификация ароматических систем по свойствам симметрии может быть проведена с помощью оператора Л = а С", применяемого также для канонизации ПНК-кодов структурных формул (см. 5). Для классификации структурной формулы по элементам симметрии достаточно определить ее плоскости симметрии и поворотные оси. Обозначив линейную запись через Ь, запишем определение, соответствующее наличию в регулярной структуре поворотных осей (при повороте структуры на 60°) С" Ь = Ь. [c.161]

    Простейшим способом преобразования структурной формулы в форму, доступную компьютеру, служит использование кодов структурных фрагментов. Примерами таких фрагментов являются ароматические кольца, алифатические радикалы, ОН- или азо-группы (-N=N-). Такие фрагменты нумеруют и заносят в соответствующий список. В более общем случае выбирают некоторый атом в качестве условного центра молекулы и последовательно описывают связанные с ним фрагменты в пределах четырех концентрических сфер от ближайших ко все более удаленным. [c.582]


    Из наиболее трудных задач, решаемых в настоящее время, можно упомянуть анализ вирусной РНК с длиной цепи порядка 4500 звеньев и рибосомальной РНК кишечной палочки. Наибольшим достижением явилась расшифровка последовательности нуклеотидов в пределах целого гена (387 звеньев) в вирусной РНК. Для анализа ДНК эта программа еще практически не осуществлялась. Та часть цепи, к-рая кодирует белки, нам известна, т. к. можно определить структурные ф-лы белков (это сделать гораздо легче), а генетич. код изучен. Но в полинуклеотидной цепи имеются дополнительные участки, служащие целям регуляции — запускающие редупликацию и транскрипцию, помогающие управлять этими процессами, а также и другими не менее важными генетич. процессами (напр., рекомбинацией — образованием смешанного потомства). Изучение структурных формул Н. к. обещает пролить свет на многие неизвестные стороны биологич. явлений. [c.196]

    Значит, и эта — явно неживая — молекула умеет как-то выбирать из среды нужные компоненты и строить из них полимер в соответствии с кодом, заданным ее структурной формулой. Ни дать, ни взят.ь ДНК  [c.89]

    Для создания автоматизированных ИПС по химии особое значение имеет ввод в них структурных формул органических соединений. Эта задача в настоящее время обычно решается на основе фрагментных кодов, в которых соединение рассматривается как сумма определенных фрагментов, каждый из которых имеет свое условное обозначение. [c.136]

    Таким образом, для поиска информации по химии нужно иметь средства описания требуемых химических структур. Среди способов, позволяющих сделать это, основными являются три использование фрагментов систематических названий соединений и их сочетаний с учетом расположения использование фрагментарного кода использование структурных формул. Все эти три способа, не исключая и последнего, имеют свои достоинства и свои недостатки. Поэтому наиболее развитые поисковые системы по химии не отказываются ни от одного из них, представляя пользователю возможность вести поиск по конкретному запросу так, как ему в данном случае удобно. [c.48]

    Если говорить о средствах работы с химической информацией, то они заметно различаются в политематических службах, использующих в качестве базовой стандартную схему поиска, и в специализированных службах, связанных с регистрационными системами и оперирующих совершенно иным образом. В первых системах основной вид поиска по структуре — это поиск по названиям и их фрагментам во вторых — по структурным формулам и фрагментарным кодам. [c.49]

    Аналогичны и основные задачи систем кодирования и канонизации в автоматизированной ИПС для органической химии одной линейной записи (коду) должна соответствовать только одна структурная формула одной структурной формуле должна соответствовать только одна каноничная машинная запись. [c.43]

    В соответствии с принятой в работе [21] терминологией системы кодирования с полным отображением структурно-химической информации будем называть полными . Неполные системы кодирования, отображая структурные фрагменты, не передают полностью информацию о химической структуре, т. е. один код может соответствовать нескольким структурным формулам. [c.49]

    Рассмотрим данный вопрос в связи со степенью дробности фрагмента структурной форму.11Ы, отображаемой в виде отдельного символа в коде. Предположим, что мы составили упорядоченный ряд масштабов дробности отображения a , аз, ад,. .., Левый предельный член ряда соответствует наиболее дробному отображению каждому атому структурной формулы ставится в соответствие отдельный символ кода. Подобные системы кодирования называют топологическими или поатомными. За правый предельный член ряда (максимальный масштаб) мы можем формально считать [c.49]

    Желательно иметь простые правила отображения в виде отдельного символа крупного блока структурной формулы (крупноблочное кодирование), так как в этом случае получаются короткие коды. Особо выгодно, чтобы при этом просто кодировались наиболее распространенные структурные формулы, поскольку простота кодирования прямо связана со скоростью кодирования. Статистическое согласование выхода системы кодирования со входом остальной части ИПС требует, чтобы коды наиболее распространенных структурных формул расшифровывались в ЭВМ наиболее эффективно — с максимальной скоростью. [c.51]

    Канонические системы кодирования, предусматривающие взаимнооднозначное соответствие кода и структурной формулы, как правило, весьма сложны. Ручная канонизация неизбежно связана с резким усложнением правил кодирования, что приводит к ошибкам кодирования. [c.51]

    Заканчивая краткий обзор основных требований к системам кодирования, отметим, что желательно, чтобы система кодирования обеспечивала возмон ность алгоритмического обнаружения по меньшей мере части ошибочных кодов. Для этого необходимо, чтобы язык линейной записи структурных формул позволял сформулировать понятия осмысленных и неосмысленных цепочек данного языка. Теоретически для любой системы кодирования можно сформулировать правила обнаружения неосмысленных цепочек. Однако желательно, чтобы эти правила обладали технологичностью, т. е. обеспечивали возмоншость простой машинной реализации алгоритма обнаружения ошибочных кодов. [c.51]


    Во втором алгоритме также используется однобитовое кодирование интенсивностей пиков (т. е. рассматриваются только совокупности массовых чисел), сравнение спектров осуществляется с помощью операций математической логики, а для представления структурных формул со-едицений использована линейная форма их записи на основе кода Висвессера [86]. [c.98]

    Ввиду явной нецелесообразности канонической поатомной записи сложных органических молекул все известные поатомные системы кодирования являются неканоничными. Поатомные коды структурных формул, как правило, представляют собой ту или иную модификацию (0,1) матрицы инциденций графа. Приводим изображение некоторого графа и соответствующей ему матрицы инциденций. [c.52]

    Рассматриваемая система предназначалась для специализированной ИПС для класса соедипений с сопряженными связями, что оказало влияние на выбор дескрипторов. Было выбрано пять классов дескрипторов В — характеристика циклической разветвленности структурной формулы В — размер кольца В,—состав циклической системы В — число колец в циклической системе В," — состав заместителей. В рассматриваемой системе т -= 2 -н 15, т. е. каждый класс дескрипторов содержит от 2 до 15 отдельных дескрипторов. Автоматическое индексирование проводилось непосредствеппо по входным кодам структурных формул. В подобных случаях особое значение приобретает технологичность машинной расшифровки входных кодов. Это определяется том, насколько явно в коде отображена организация исходного графического изображения структурной формулы — скелет циклической системы, гетероатомы, заместители, связки и т. д. [c.123]

    Подобные модификации химик может проводить во время поиска. Для вывода информации используется блок отображения марки В ЕС-340 (визуальный вывод) и графопостроитель марки Сакошр (графический вывод). Блок отображения использует 3 экрана, на которых отображаются структура во время ввода и ее модификации, дерево синтеза и некоторые структуры, выбранные из этого дерева. ЭВМ автоматически переводит графическое изображение структурной формулы в матрицу связи, которая используется в качестве машинного кода структурной формулы. [c.178]

    Описывая подобные алгоритмы на языке операций, производимых над р-сетью, мы подразумеваем, что р-сеть записана в память автоматизированной информационной системы. Действительно, система взаимных отсылок меиеду подсистемами соединений и реакций, которая должна быть установлена, как указывалось в 13.6, в крупномасштабной автоматизированной информационной системе, не только полностью, но и избыточным образом описывает р-сеть. При этом каждая стрелка р-сети записана двумя ссылками ссылкой на регистрационный номер некоторой реакции, имеющейся при коде структурной формулы соединения, и ссылкой на регистрационный номер некоторого соединения, фигурирующей при коде структурного уравнения конкретной реакции. На основе этих ссылок р-сеть может быть, выписана машиной отдельно в более компактной форме в терминах регистрационных номеров соединений и реакций и храниться в таком виде. [c.286]

Рис. 13.2-3. Сферы , окружающие атом углерода (выделен жирным шрифтом) и служащие основой для кодирования структурной формулы в коде HOSE. Рис. 13.2-3. Сферы , окружающие <a href="/info/10974">атом углерода</a> (<a href="/info/39768">выделен жирным</a> шрифтом) и служащие основой для <a href="/info/141427">кодирования структурной формулы</a> в коде HOSE.
    Простое перечисление отдельных фрагментов молекулы еще не позволяет приписать ей определенную структурную формулу. Следующим этапом построения структурной формулы является соединение фрагментов друг с другом в определенном порядке. Полученную гипотетическую структуру следует фавнить со всеми возможными структурными формулами атом за атомом. Разумеется, при этом следует рассматривать только те молекулы, которые содержат все перечисленные в коде фрагменты. [c.583]

    При необходимости описать строение более длинных молекул можно также воспользоваться однобуквенньпл кодом, в котором каждой аминокислоте присвоена одна заглавная буква латинского алфавита аланин - А, аспарагин - N, аспарагиновая кислота О, аргинин - Я, валин - V, гистидин - Н, глицин - О, глутамин О, глутаминовая кислота - Е, изолейцин - I, лейцин - Ь, лизин - К, метионин - М, пролин - Р, серии - 8, тирозин - V, треонин Т, триптофан - фенилаланин - Р, цистеин " С. С использованием этого кода вместо громоздкой структурной формулы, написанной в начале страницы, можно записать УЯМ. [c.54]

    Код конкретной химической структуры представляется как набор таких дескрипторов, соответствующий всем возможным путям между соседними ДС, покрывающим структурную формулу. Нами проведены успешные эксперименты по исследованию связи структуры и биологического действия в языке ФКСП. В частности, разработан метод классификации химических соединений по пред- [c.120]

    Основной внутримашинной формой записи структурных формул являются топологические коды, в которых перечислены все атомы и связи. Одной из форм является таблица связей по Глюку [9], используемая в hemi al Abstra ts Servi e . Так, напри.мер, карбоксильный фрагмент в этой таблице отражен следующим образом  [c.138]

    Химические формулы кодируются в настоящее время главным образом с помощью линейной индексации Висвессера. Недостатки этой системы заключаются в том, что участки структурных формул обозначаются неоднозначно и неудовлетворительно описываются формулы Маркуша. (Формулы Маркуша-это структурные формулы органических соединений, в которых определенные детали, например вид и место функциональных групп, строго не фиксируются. Из-за этого их охотно используют в патентной литературе.) В системе Гремас, разработанной в ФРГ (фабрика красок Хохст ), атомы углерода цепи обозначаются иначе, чем атомы углерода, связанные с функциональной группой, причем используются трехбуквенные символы (троичные термы). Таким образом, по этому коду можно осуществить поиск и частичных структур, и отдельных участков структурных формул. Эффективность информационного поиска с помощью указанных кодов довольно высока в среднем на каждые десять публикаций приходится одна, в которой не затрагивается конкретно интересующая проблема. Если все же требуются дополнительные уточнения, то помощь в этом может оказать топологический код. В нем детально фиксируются все атомы, входящие в структуру, а также все связи между атомами, т.е. каждая структура описывается совершенно однозначно. Однако для этого потребуется больше машинного времени, и, следовательно, информационный поиск обойдется дороже. Поэтому такой код применяют не ко всему информационному массиву, [c.107]

    Использование весьма мощных поисковых возможностей, предоставляемых этими системами, предъявляет высокие требования к пользователю. Даже если работать со средствами графического построения структур, наиболее естественными для химиков, надо владеть сложными системами команд. Бесспорно, поиск по фрагментам структурных формул обеспечивает наибольшую комфортность диалога и эффективность поиска точно определенных классических органических структур. Однако в существенной доле случаев поиск по номенклатуре, фрагментарному коду и учет элементов брутто-формулы позволяет получить такой же результат с меньшими затратами. Сюда относятся случаи, в которых множество структурных формул, описывающих требуемый класс соединений, слишком велико или размыто. Например, AS Online рекомендует пользоваться фрагментарным кодом в следующих случаях 1) описывается фрагмент структуры, недостаточный для автоматической генерации набора фильтров, обеспечивающего приемлемый уровень отсева 2) класс соединений не может быть эффективно задан в виде одного или нескольких фрагментов структурной формулы (например, требуются только алкильные производные заданной структуры) 3) требуется учесть интегральные либо нетопологические характерист-ики структуры (полимеры, стереохимия и др.). Можно отметить, что графические средства эффективны для большинства (но не для всех) достаточно специфичных запросов на конкретные фрагменты классических органических соединений. [c.57]

    В обзоре Г. Э. Влэдуца и соавторов [27] предлагается кодовые языки, применяемые для описания структур химических соединений, делить в соответствии с их использованием в информационно-поисковых системах на три группы 1) языки для ввода, 2) для поиска и 3) для хранения информации. При анализе различных способов кодирования структурной информации авторы используют такие их характеристики, как полнота, по-атомность и каноничность. По мнению авторов, наличие нескольких специализированных (ввод, поиск и т. д.) форм записей структуры не должно вызвать трудностей, так как универсальные ЭВМ уже сегодня с успехом осуществляют перевод одного кода в другой. Этот факт заставляет, признать наиболее удобным языком — простой поатомный язык топологического описания структурных формул. [c.27]

    Первым процессором является блок кодирования структурной химической информации. При рассмотреинн структурной формулы химик видит (т. е. зрительно выделяет) различш.ю ее фрагменты, взаиморасположение различных фрагментов (гетероатомов, заместителей и т. д.). Для моделирования на ЭВМ видения структурной формулы, ее анализа, классификации и т. д. необходимо нро 1 л,е всего представить структурную формулу и виде линейного набора символов (линейной записи, кода), доступного д.тя машинного погшмаиия , т. е. допускающего формализованный (алгоритмический) анализ. Совокупность грамматических правил и соответствующей лексики, позволяющая прообразовать графическое изображение структурной формулы в линейную запись, называется входным языком или системой кодирования органических соединений. В качестве блока кодирования АИС может служить оператор, использующий соответствующую систему кодирования, или полуавтомат (папример, специализированная пишущая машинка), или устройство автоматического считывания графи- [c.39]

    Как показали машинные эксперименты, поиск по машинным кодам занимает достаточно большое машинное время. В связи с этим в автоматизированной ИПС можно использовать предварительный отбор узких классов соединений, соответствующих данному запросу, и вести тонкий поиск по машинным кодам в узком классе соединений. Отбор подобных узких классов соединении может осуществляться блоком внутри-машидной организации структурных формул и адресации запросов. Входной информацией этого блока служат каноничные машинные коды и набор индексов данной структурной формулы, алгоритмически вырабатываемый блоком автоматической индексации. Набор индексов характеризует наличие в структурной формуле тех или иных фрагментов, папример, конденсированной ароматической системы, фрагмента — N — О — С — или [c.42]

    Машинные коды в виде матриц неудобны для непосредственного обо-з 1ения человеком. Поэтому машинные коды с выхода блока 8 поступают в блок отображения структурной информации 9. Этот блок может включать автоматическое цифровое печатающее устройство (АЦПУ) ЭВМ, т.е. ЭВМ иечатает двумерное изображение структурных формул. При наличии соответствующих периферийных устройств типа дисплэй выходная структурная информация может быть отображена на экране для визуального обо-з[)ения. [c.42]

    Первая задача связана с полнотой отображения структурной информации, так как если одному коду соответствует несколько структурных формул, то правила кодирования (соответственно, правила записи номенклатурного названия) допускают потерю информации. Вторая задача связана с проблемой идентификации структурных формул в ЭВМ (в случае автоматизированных ИПС) или по традиционным предметным указателям органических соединений (ири использовании номенклатурных названий). Однако, как хорошо известно химикам, однозначное наименование органического соединения дать нелегко, вследствие слоншости правил номенклатуры. Насколько сложны правила номенклатуры, свидетельствует тот факт, что для изложения Правил номенклатуры органических соединений ШРАС потребовалось около 400 страниц [16]. Аналогичные трудности возникают при линейной заниси структурной формулы для ввода в ЭВМ составить однозначный (каноничный) код нелегко. Известно, что химики нередко дают одному и тому же соединению несколько различных наименований [17]. В некоторых случаях химики делают это сознательно стремясь подчеркнуть принадлежность структуры к данному классу (или отразить в названии генетическую связь с некоторым классом структур), они выде- ляют, подчеркивают соответствующий фрагмент структуры. Как известно, еще Правила Женевской номенклатуры [16, 17], принятые в 1892 г., констатировали, что наряду с применяемыми ныне названиями для каждого органического соединения долл но быть установлено ого официальное на- [c.43]


Смотреть страницы где упоминается термин Коды структурных формул: [c.194]    [c.192]    [c.41]    [c.42]    [c.115]    [c.168]    [c.582]    [c.31]    [c.198]    [c.371]    [c.138]    [c.142]    [c.109]    [c.41]    [c.42]    [c.48]   
Автоматизированные информационные системы для химии (1973) -- [ c.0 ]




ПОИСК





Смотрите так же термины и статьи:

Алгоритм преобразования входных кодов в машинный вариант записи структурных формул

Структурные формулы

коду



© 2025 chem21.info Реклама на сайте