StaCoRT

Предиктор констант устойчивости с использованием комбинированного подхода ТР-АРМ

Комбинированный подход на основе термодинамических радиусов (ТР) ионов металлов и ансамблей регрессионных моделей (АРМ) применяется для прогнозирования констант устойчивости (logK) ML комплексов 26 ионов металлов (M = Ca2+, Cd2+, Co2+, Cu2+, Fe2+, La3+, Mg2+, Mn2+, Ni2+, Pb2+, Th4+, VO2+, Y3+, Zn2+, Ce3+, Pr3+, Nd3+, Sm3+, Eu3+, Gd3+, Tb3+, Dy3+, Ho3+, Er3+, Tm3+, Yb3+, Lu3+) с разнообразными органическими лигандами (L) в воде. Программное обеспечение находится в открытом доступе на сервере http://vpsolovev.ru/programs/ как программа StaCoRT (Stability Constants by Radii Thermodynamic), функционирующая под операционными системами Windows. Программа представляет собой графический интерфейс, управляющий рабочим процессом и поддерживающий анализ результатов, представленных таблицами, связанными с двумерными структурами лигандов и с графиком корреляции между экспериментальными и предсказанными величинами logK.

Predictor of Stability Constants using Combined RT-ERM Approach

The combined approach on the base of radii thermodynamic (RT) of metal ions and ensembles of regression models (ERM) is applied to predict the stability constants (log K) of the ML complexes of 26 metal ions (M = Ca2+, Cd2+, Co2+, Cu2+, Fe2+, La3+, Mg2+, Mn2+, Ni2+, Pb2+, Th4+, VO2+, Y3+, Zn2+, Ce3+, Pr3+, Nd3+, Sm3+, Eu3+, Gd3+, Tb3+, Dy3+, Ho3+, Er3+, Tm3+, Yb3+, Lu3+) with various organic ligands (L) in water. The software is publically available on the server http://vpsolovev.ru/programs/ as the program StaCoRT (Stability Constants by Radii Thermodynamic) under Windows operating systems. The program is a graphical interface that controls a workflow and supports analysis of the results, represented by tables related to the 2D ligand structures and the correlation graph between the experimental and predicted logK values.

MComSim

Predictor MComSim

Программа для предсказания констант устойчивости комплексов ионов металлов с органическими лигандами.

Программа для предсказания констант устойчивости (logK) ML комплексов 42 ионов металлов (M = Ag+, Al3+, Am3+, Ba2+, Be2+, Ca2+, Cd2+, Co2+, Cu2+, Fe2+, Fe3+, Ga3+, Hg2+, In3+, K+, La3+, Li+, Mg2+, Mn2+, Na+, Ni2+, NpO2+, Pb2+, Sr2+, Th4+, UO22+, VO2+, Y3+, Zn2+, Ce3+, Pr3+, Nd3+, Sm3+, Eu3+, Gd3+, Tb3+, Dy3+, Ho3+, Er3+, Tm3+, Yb3+, Lu3+) с разнообразными органическими лигандами (L) в воде была разработана на основе предложенных нами термодинамических ионных радиусов металлов. Расчет константы устойчивости комплекса одного иона металла может быть выполнен с использованием известных значений logK для другого металла или всех доступных значений logK для нескольких металлов одновременно. Предиктор в виде программы MComSim (Metal Complexation Similarity) работает под операционной системой Windows разных версий. Программа представляет собой графический интерфейс, управляющий рабочим процессом и поддерживающий анализ результатов, связанных с двумерными структурами лигандов. Используя экспериментальные данные, включающие 1990 органических лигандов и 8269 значения logK для 42 ионов металлов, MComSim оценивает более 75000 значений logK потенциальных комплексов в воде при температуре 298 K и ионной силе 0.1 M.

A predictor of the stability constants logK of the ML complexes of 42 metal ions (M = Ag+, Al3+, Am3+, Ba2+, Be2+, Ca2+, Cd2+, Co2+, Cu2+, Fe2+, Fe3+, Ga3+, Hg2+, In3+, K+, La3+, Li+, Mg2+, Mn2+, Na+, Ni2+, NpO2+, Pb2+, Sr2+, Th4+, UO22+, VO2+, Y3+, Zn2+, Ce3+, Pr3+, Nd3+, Sm3+, Eu3+, Gd3+, Tb3+, Dy3+, Ho3+, Er3+, Tm3+, Yb3+, Lu3+) with diverse organic ligands (L) in water was created using thermodynamic ionic radii. Predictions of the stability constants for one metal ion can be performed using known logK for other metal or all available logK values for several metals simultaneously. The predictor as the program MComSim (Metal Complexation Similarity) works under Windows operating systems. The program is a graphical interface piloting a workflow and supporting analysis of the results linked to the 2D ligand structures. Based on experimental data including 1990 organic ligands and 8269 logK values for the studied 42 metal ions, MComSim predicts more than 75000 logK values of potential complexes in water at temperature 298 K and an ionic strength 0.1 M.

Использование MComSim

Распаковать архив, содержащий директорию программы MComSim. Программа не требует инсталляции. Программа функционирует под операционной системой Windows разных версий. Исполняемый файл программы MComSim.exe.

Using MComSim

Unpack the archive containing the MComSim program directory. The program (MComSim.exe) runs under the Windows operating systems.

LanComSim

Соловьев В.П.a, Варнек А.А.b

a Институт физической химии и электрохимии им. А. Н. Фрумкина Российской академии наук, Российская Федерация, 119991 Москва, Ленинский просп., 31, корп. 4

b Laboratoire de Chémoinformatique, UMR 7140 CNRS, Université de Strasbourg, 1, rue Blaise Pascal, 67000 Strasbourg, France

Программа LanComSim используется для предсказания констант устойчивости logb1 и logb2 комплексов ML и ML2 лантанид ионов (M) от Ce3+ до Lu3+ с органическими лигандами (L) в воде при температуре 298 К и ионной силе 0.1 М. Предсказания выполняются на основе термодинамических ионных радиусов (r1 и r2), установленных при анализе большого набора известных констант устойчивости комплексов лантанидов. Нами показано, что константы устойчивости двух металлов Mi и Mj с данным лигандом L взаимосвязаны простыми уравнениями logb1j = r1i/r1j.logb1i и logb2j = r2i/r2j.logb2i. Программа предсказывает неизвестные 2931 (1081) значения констант logb1 (logb2), используя экспериментальные данные о 2854 logb1 величинах для 445 органических лигандов и 947 logb2 величинах для 156 органических лигандов.

Vitaly Solov’eva, Alexandre Varnekb

a A.N. Frumkin Institute of Physical Chemistry and Electrochemistry, Russian Academy of Sciences, Leninskiy prosp., 31, 119071 Moscow, Russia

b Laboratoire de Chémoinformatique, UMR 7140 CNRS, Université de Strasbourg, 1, rue Blaise Pascal, 67000 Strasbourg, France

The program LanComSim is used for predictions of the stability constants logb1 and logb2 of the ML and ML2 complexes of lanthanide ions M (from Ce3+ to Lu3+) with organic ligands (L) in water at 298 K and ionic strength 0.1 M. The predictions is performed with using thermodynamic ionic radii (r1 and r2) of lanthanide ions. The radii derived from the analysis of large set of the stability constants logb1 and logb2 of the ML and ML2 complexes of lanthanides. We demonstrated that the stability constants of two metals Mi and Mj with a given ligand L are related by the simple equations logb1j = r1i/r1j.logb1i and logb2j = r2i/r2j.logb2i. The program predicts unknown 2931 (1081) of logb1 (logb2) values of the potential complexes using experimental data on 2854 logb1 values for 445 organic ligands and 947 logb2 values for 156 organic ligands in the complexes of 13 lanthanides.

Использование LanComSim

Распаковать архив, содержащий директорию программы LanComSim. Программа не требует инсталляции. Программа функционирует под операционной системой Windows разных версий. Исполняемый файл программы LanComSim.exe.

Using LanComSim

Unpack the archive containing the LanComSim program directory. The program (LanComSim.exe) runs under the Windows operating systems.

ISIDA_NB

Программа ISIDA_NB представляет собой реализацию консеснусного наивного байесовского классификатора. Процесс моделирования включает в себя (i) создание множества индивидуальных классификационных моделей, (ii) выбор наиболее прогностических моделей и (iii) согласованное применение выбранных моделей к соединениям тестового набора.

Ансамбль индивидуальных классификационных моделей генерируются с использованием перебора параметров байесовской классификации, методов отбора дескрипторов и типов молекулярных фрагментов в качестве дескрипторов. Программа работает под управлением операционной системы Windows, имеет графический интерфейс для управления рабочим процессом и анализа полученных результатов. Встроенный инструмент Consensus Predictor реализует предсказание свойств и виртуальный скрининг с использованием ранее полученных моделей.

The ISIDA_NB program is an implementation of consensus naive Bayesian classifier into the ISIDA_QSPR program. Ensemble modeling workflow of the ISIDA_NB program includes (i) generation of ensemble of individual classification models, (ii) selection of the most predictive ones using internal and external cross-validations and (iii) consensus application of selected models to a test set compounds.

Ensembles of individual models are generated by varying parameters of naive Bayesian model (weight of Laplace correction, score threshold), variable selection techniques (variable filtering, excluding concatenated fragments) and using of multiple types of molecular fragments as descriptors. The program runs under the Windows operating system. The graphical interface pilots this workflow and supports the analysis of the obtained results. The Consensus Predictor tool realizes property predictions and virtual screening using previously obtained consensus models.

FMF_HH

Программа FMF_HH используется для предсказания констант устойчивости:

  1. комплексов органических соединений (акцепторов водородной связи) с 4-фтор-фенолом в качестве эталонного донора водородной связи в CCl4;
  2. комплексов органических соединений (акцепторов галогенной связи – оснований Льюиса) с йодом (I2) в качестве эталонного донора галогенной связи в алканах (гептан, циклогексан, гексан, метилциклогексан).

The FMF_HH program is used for the estimations of the stability constants:

  1. for the complexes of organic compounds (Hydrogen bond bases) with 4-fluoro-phenol as the reference Hydrogen bond donor in CCl4;
  2. for the complexes of organic compounds (Halogen bond acceptors or the Lewis bases) with diiodine (I2) as a reference Halogen bond donor in alkanes (heptane, cyclohexane, hexane, methylcyclohexane).

Программа рассчитывает константы устойчивости (logK) для комплексов состава 1:1 (акцептор:донор) с образованием одной связи при температуре 298 K (25°C).

Для выполнения расчетов «органические молекулы – акцепторы» необходимо подготовить в формате файла «структура – данные» (SDF — Structure Data File). Величины logK оцениваются консенсус моделями, как среднее арифметическое величин, предсказанных большим числом индивидуальных ISIDA/QSPR моделей, исключая те отдельные величины, которые являются резко выделяющимися значениями и находящимися за пределами области применения индивидуальных моделей [1].

Использование FMF_HH

Распаковать архив, содержащий директорию программы FMF_HH. Программа не требует инсталляции, но рекомендуется размещать её не на системном диске.

The program assesses the stability constants (logK) for the 1:1 complexes at standard temperature 298K (25°C).

Organic molecules can be submitted as a Structure-Data file (SDF). The predicted complexation constants are evaluated by the consensus model (CM) as an arithmetic mean of values obtained by numerous individual ISIDA/QSPR models excluding those leading to outlying values and being outside model applicability domain (AD) of individual models [1].

Using SMF

Unpack the archive containing FMF_HH program directory.

Литература

References

FMF

Программа FMF используется для предсказания констант устойчивости комплексообразования катионов металлов (M) с органическими лигандами (L) в воде.

The FMF program is used for the estimations of the stability constants for the complexation of metal ions (M) with organic ligands (L) in water.

В настоящее время программа определяет константы устойчивости logK комплексов состава 1:1 (M:L) для 12 катионов металлов:

Li+, Na+, K+Be2+, Al3+, Ga3+, In3+, VO2+, Fe3+, Th4+, NpO2+ и Am3+

с разнообразными органическими лигандами в воде при стандартной температуре 298 К (25 С°) и ионной силе 0.1 М. Величины logK вычисляются консенсус моделями, как среднее арифметическое величин, предсказанных большим число индивидуальных ISIDA/QSPR[1—5] моделей, исключая те отдельные величины, которые являются резко выделяющимися значениями и находящимися за пределами области применения индивидуальных моделей [1—5].

Использование FMF

Распаковать архив содержащий директорию программы FMF. Программа не требует инсталляции.

At present, the program assessed the stability constants (logK) for the 1:1 (M:L) complexation of 12 metal ions (Li+, Na+, K+Be2+, Al3+, Ga3+, In3+, VO2+, Fe3+, Th4+, NpO2+ и Am3+) with various organic ligands in water at standard temperature 298 K (25 C) and an ionic strength I = 0.1 M. The logK values are predicted by consensus models (CMs) as an arithmetic mean of values obtained by great number of individual ISIDA/QSPR [1 – 5] models excluding those leading to outlying values and being outside applicability domains of individual models.

Using SMF

Unpack the archive containing the FMF program directory.

Литература

References

SMF

Субструктурные молекулярные фрагменты (СМФ) являются дескрипторами (независимыми переменными) для QSAR/QSPR моделирования (для построения моделей, связывающих структуру химического соединения со свойством вещества). Субструктурные молекулярные фрагменты являются подграфами молекулярного графа. Число вхождений заданного фрагмента в молекулярный граф является значением дескриптора. Субструктурные молекулярные фрагменты — подходящие дескрипторы для QSAR/QSPR моделирования физических, химических и биологических свойств (Публикации). 2D или 3D структуры химических соединений, представленные стандартным файлом структура-данные (SDF), служат в качестве входных данных для программы SMF. Файл SDF включает моделируемое свойство в качестве поля данных.

Substructural Molecular Fragments (SMF) are descriptors (independent variables) for the QSAR/QSPR modeling. The Substructural Molecular Fragments are subgraphs of a molecular graph. The counts of the fragments of molecular graphs are descriptor values. Substructural Molecular Fragments are applicable descriptors for QSPR modeling of physical, chemical and biological properties (Publications). 2D or 3D structures of chemical compounds presented by standard SD file (SDF) serve as an input data of the SMF program. The SD file includes modeling property as data field.

Выходные данные программы:

  1. *.SMF файл дескрипторов в TXT формате;
  2. Если файл SDF включает моделируемое свойство и оно отмечено в программе SMF, то будет создан файл *.PRP значений моделируемого свойства;
  3. Если флажок для генерации входного файла для пакета LIBSVM выставлен, то будет создан *.SVM файл. Подробнее о программе и дескрипторах смотрите в файле SMF_HELP.rtf программы SMF.

Использование SMF

Распаковать архив содержащий директорию программы SMF. Программа не требует инсталляции.

Output data of the program:

  1. the *.SMF file of descriptors in the TXT format;
  2. if the SD file has modeling property and the property is selected in the SMF program, the *.PRP file of modeling property will be generated;
  3. If checkbox for generation of input file for the LibSVM package is checked, the *.svm file will be created. For details, see the SMF_HELP.rtf file of the SMF program.

Using SMF

Unpack the archive containing the directory the SMF program.

Литература

References

ChemEqui

Программа ChemEqui рассчитывает константы химических равновесий и сопутствующие параметры, исходя из экспериментальных результатов физико-химических методов, таких как УФ, ИК и ЯМР спектроскопия, калориметрия, потенциометрия и кондуктометрия. Константы равновесий рассчитываются методом наилучшей подгонки экспериментальных данных к расчетным величинам для выбранной (предполагаемой) модели равновесий (равновесных реакций).

The ChemEqui program realizes the method of non-linear least-squares for computations of equilibrium constants and related quantities from experimental results of UV/Vis, IR and NMR spectroscopy, calorimentry, potentiometry and conductometry. The equilibrium constants are calculated by best-fitting of the experimental data with an estimated chemical model of the equilibrium system.

В ChemEqui используются три подхода для поиска минимума системы нелинейных уравнений методом наименьших квадратов: метод Ньютона-Гаусса с аналитическим представлением производных (высокая скорость расчетов), симплекс алгоритм и метод Монте-Карло. Это позволяет существенно улучшить надежность расчетов равновесных констант.

Использование ChemEqui

Распаковать файл архив содержащий директорию ChemEqui. Рекомендуется использовать несистемный диск для директории ChemEqui в случае Windows 7 и Windows Vista.

CHemEqui uses three algorithms of minimization to solve non-linear least squares problems: Gauss—Newton with analytical presentation of derivatives, Simplex and Monte Carlo allowing one to significantly improve the reliability of the stability constant calculations.

Using ChemEqui

Unpack the archive containing the directory the ChemEqui program. For Windows 7 and Windows Vista, the utilization of non-system disk for the ChemEqui directory is preferable.

Литература

References

EdiSDF

Редактор EdiSDF предназначен для визуализации, управления и редактирования файлов, содержащих химические 2D и 3D формулы в формате Structure-Data Files (SDF).

The editor EdiSDF provides visualization, management and edition of Structure-Data Files (SDF) of chemical 2D and 3D formulae.

edisdf

Редактор EdiSDF является частью проекта ISIDA. Проект ISIDA — совместный проект между проф. А. Варнеком (Лабораторией химической информатики, UMR 7177 CNRS, Universite de Strasbourg, 4, rue B.Pascal, Strasbourg, 67000, France) и д.х.н. в.н.с. Соловьевым В.П. (Лаборатория новых физико-химических проблем, зав. академик Цивадзе А.Ю., Институт физической химии и электрохимии, РАН, 119991 Москва, Ленинский пр., 31а).

Редактор EdiSDF включает:

  1. Редактор EdChemS химических 2D формул. Windows 32-bit;
  2. Программу CombiLib для генерации виртуальных химических соединений (библиотек);
  3. Программу FMF для предсказания физических, химических и биологических свойств с использованием готовых моделей ISIDA/QSPR;
  4. Редактор TXTEditor текстовых файлов.

EdiSDF на сайте Страсбургского университета

Использование EdiSDF

Распаковать архив содержащий директорию редактора EdiSDF. Программа не требует инсталяции.

The EdiSDF program is a part of the ISIDA project. ISIDA is a collaborative project between the Laboratory of Chemoinformatics by Prof. Alexandre Varnek (Laboratoire d’Infochimie, UMR 7177 CNRS, Universite de Strasbourg, 4, rue B.Pascal, Strasbourg, 67000, France) and Dr. Vitaly Solov’ev (Institute of Physical Chemistry and Electrochemistry, Russian Academy of Sciences, Leninskiy prospect, 31a, 119991, Moscow, Russian Federation).

EdiSDF includes:

  1. The EdChemS editor of chemical 2D formulae. Windows 32-bit;
  2. The CombiLib program for a generation of virtual chemical compounds (Libraries);
  3. The FMF program for predictions of physical, chemical and biological properties using developed ISIDA/QSPR models;
  4. The TXTEditor for text files.

EdiSDF at Strasbourg University page

Using EdiSDF

Unpack the archive containing the directory the EdiSDF program.

Литература

References

ISIDA/QSPR

В программе ISIDA/QSPR используются субструктурные молекулярные фрагменты (SMF) и многомерный линейный регрессионный анализ (MLR) для QSPR и QSAR моделирования и предсказания физических, химических и биологических свойств.

The ISIDA/QSPR program realizes Multiple Linear Regression Analysis (MLR) and Substructural Molecular Fragments (SMF) for QSPR and QSAR modelling and prediction of physical, chemical and biological properties.

isida_qspr

В качестве исходных данных в ISIDA/QSPR служат известные экспериментальные величины моделируемого свойства для ряда соединений обучающего набора данных. Субструктурные молекулярные фрагменты как подграфы молекулярных графов соединений применяются в качестве дескрипторов (независимых переменных) в QSPR моделях. Как правило, применяются кратчайшие топологические пути. Кратность фрагмента в соединении — величина дескриптора. Дескрипторы вычисляются исключительно из данных о структурной (2D) формуле соединения.

Привлекается оригинальная комбинированная пошаговая техника увеличения и уменьшения числа SMF дескрипторов в модели для выбора переменных из их исходного множества, обеспечивающих наилучшее предсказание свойства.

ISIDA/QSPR генерирует множество устойчивых MLR моделей, каждая их которых соответствует применяемому типу SMF дескрипторов и методам ступенчатого отбора переменных. Для надежного предсказания свойств используется консенсус модель. Консенсус модель объединяет предсказания множества индивидуальных моделей. Программа рассчитывает свойство как арифметическое среднее величин, вычисленных с помощью наиболее устойчивых индивидуальных моделей, исключая выпадающие величины и применяя методы по оценке области применимости каждой индивидуальной модели.

Программа ISIDA/QSPR является частью проекта ISIDA. Проект ISIDA — совместный проект между проф. А. Варнеком (Лабораторией химической информатики, UMR 7177 CNRS, Universite de Strasbourg, 4, rue B.Pascal, Strasbourg, 67000, France) и д.х.н. в.н.с. Соловьевым В.П. (Лаборатория новых физико-химических проблем, зав. академик Цивадзе А.Ю., Институт физической химии и электрохимии, РАН, 119991 Москва, Ленинский пр., 31а).

Программа ISIDA/QSPR включает:

  1. Редактор EdiSDF, предназначенный для визуализации и редактирования файлов, содержащих химические 2D и 3D формулы в формате Structure-Data Files (SDF). Входные данные для программы ISIDA/QSPR представлены файлами SDF.
  2. Программу FMF для предсказания физических, химических и биологических свойств с использованием готовых моделей ISIDA/QSPR.
  3. Модуль MolFrag для анализа субструктурных молекулярных фрагментов (SMF) и их вкладов.

ISDA QSPR на сайте Страсбургского университета

Использование ISIDA/QSPR

Распаковать архив содержащий директорию ISIDA_QSPR. Для Windows 7 и Windows Vista строго рекомендуется размещать директорию ISIDA_QSPR не на системном диске. Программа не требует инсталляции. Файл помощи ISIDA_QSPR_Manual.doc находится в директории ISIDA_QSPR.

As initial data, ISIDA/QSPR uses known experimental values of modelling property for training set of chemical compounds. Substructural molecular fragments as subgraphs of molecular graphs of the compounds are descriptors (independent variables) in QSPR models. As a rule, shortest topological paths are applied. A fragment occurrence is a descriptor value. The descriptors are derived solely from 2D chemical structures.

Original combined forward and backward stepwise techniques are applied for selections of the most pertinent variables from initial pools of the SMF descriptors.

ISIDA/QSPR generates many MLR models; each of them corresponds to applied type of the SMF descriptors and the stepwise techniques. For reliable predictions of the properties, a consensus model is used. The consensus model combines the predictions issued from many individual models. The program computes the property as an arithmetic mean of values obtained with a collection of selected on training stage individual models excluding those leading to outlying values, and taking into account an applicability domain of each individual model.

The ISIDA/QSPR program is a part of the ISIDA project. ISIDA is a collaborative project between the Laboratory of Chemoinformatics by Prof. Alexandre Varnek (Laboratoire d’Infochimie, UMR 7177 CNRS, Universite de Strasbourg, 4, rue B.Pascal, Strasbourg, 67000, France) and Dr. Vitaly Solov’ev (Institute of Physical Chemistry and Electrochemistry, Russian Academy of Sciences, Leninskiy prospect, 31a, 119991, Moscow, Russian Federation).

ISIDA/QSPR includes:

  1. The EdiSDF editor for visualization and edition of Structure-Data Files (SDF) of chemical 2D and 3D formulae. SDF is data input format for the ISIDA/QSPR program.
  2. The FMF program for predictions of physical, chemical and biological properties using developed ISIDA/QSPR models.
  3. The MolFrag tools for the analysis of substructural molecular fragments (SMF) and their contributions.

ISDA QSPR at Strasbourg University page

Using ISIDA/QSPR

Unpack the archive containing the directory of the ISIDA_QSPR program. For Windows 7 and Windows Vista, it is strongly recommended to use of non-system disk for the ISIDA_QSPR directory. See ISIDA_QSPR_Manual.doc as help file inside the ISIDA_QSPR directory.

Литература

References

  1. Solov’ev V., Sukhno I., Buzko V., Polushin A., Marcou G., Tsivadze A., Varnek A. Stability Constants of Complexes of Zn2+, Cd2+, and Hg2+ with Organic Ligands: QSPR Consensus Modeling and Design of New Metal Binders. J. Incl. Phenom. Macrocycl. Chem., 2011, DOI 10.1007/s10847-011-9978-6
  2. Solov’ev V., Oprisiu I., Marcou G., Varnek A. Quantitative Structure_Property Relationship (QSPR) Modeling of Normal Boiling Point Temperature and Composition of Binary Azeotropes. Ind. Eng. Chem. Res., 2011, 50, No. 24, pp 14162–14167.
  3. Varnek A., Solov’ev V. Quantitative Structure-Property Relationships in solvent extraction and complexation of metals. Rev. in Book: Ion Exchange and Solvent Extraction, A Series of Advances. Vol. 19, P. 319-358. A. K. Sengupta and B. A. Moyer, Eds., CRC Press, Taylor and Francis Group: Boca Raton, 2009, 679 pp.
  4. Solov’ev, V. P.; Varnek, A. A.; Wipff, G. Modelling of Ion Complexation and Extraction Using Substructural Molecular Fragments. J. Chem. Inf. Comput. Sci., 2000, 40, P. 847-858.
  5. Varnek, A. A.; Wipff, G.; Solov’ev, V. P. Towards an Information System on Solvent Extraction. J. Solvent Extr. Ion. Exch., 2001, 19, No. 5, P.791-837.
  6. Varnek, A. A.; Wipff, G.; Solov’ev, V. P., Solotnov A.F. Assessment of The Macrocyclic Effect for The Complexation of Crown-Ethers with Alkali Cations Using the Substructural Molecular Fragments Method. J. Chem. Inf. Comput. Sci., 2002, 42, No. 4, P. 812-829.
  7. Solov’ev, V. P.; Varnek, A. Anti-HIV Activity of HEPT, TIBO and Cyclic Urea Derivatives: Structure-Property Studies, Focused Combinatorial Library Generation and Hits Selection Using Substructural Molecular Fragments Method. J. Chem. Inf. Comp. Sci., 2003, 43, No. 5, P. 1703-1719.
  8. Katritzky, A.R.; Fara, D.C.; Yang, H.; Karelson, M.; Suzuki, T.; Solov’ev, V.P.; Varnek A. Quantitative Structure-Property Relationship Modeling of ?-Cyclodextrin Complexation Free Energies. J. Chem. Inf. Comput. Sci. 2004, 44, No. 2, 529-541.
  9. Varnek, A.; Fourches, D.; Solov’ev, V. P.; Baulin, V. E.; Turanov, A. N.; Karandashev, V. K.; Fara, D.; Katritzky, A. R. «In Silico» Design of New Uranyl Extractants Based on Phosphoryl-Containing Podands: QSPR Studies, Generation and Screening of Virtual Combinatorial Library and Experimental Tests. J. Chem. Inf. Comput. Sci., 2004, 44, No. 4, 1365-1382.
  10. Solov’ev, V. P.; Varnek, A. A. Structure-Property Modeling of Metal Binders Using Molecular Fragments. Russ. Chem. Bull., Internat. Edit. (in Russ.: Izv. Akad. Nauk. Ser. Khim., 2004, No. 7, pp. 1380-1391) 2004, 53, 1434-1445.
  11. Varnek, A.; Solov’ev, V. P. «In Silico» Design of Potential Anti-HIV Actives Using Fragment Descriptors.
    Combinatorial Chem. High Throughput Screening, 2005, 8, No. 5, 403-416.
  12. Varnek, A.; Fourches, D.; Hoonakker, F.; Solov’ev, V. P. Substructural fragments: an universal language to encode reactions, molecular and supramolecular structures. J. Computer-Aided Mol. Design, 2005, 19, 693-703.
  13. Katritzky, A. R.; Kuanar, M.; Fara, D. C.; Karelson, M.; Acree, W. E. Jr.; Solov’ev, V. P.; Varnek, A. QSAR modeling of blood:air and tissue:air partition coefficients using theoretical descriptors. Bioorg. Med. Chem.,2005, 13, 6450-6463.
  14. Tetko, I. V.; Solov’ev, V. P.; Antonov, A. V.; Yao, X.; Doucet, J. P. Fan, B.; Hoonakker, F.; Fourches, D.; Jost, P.; Lachiche, N.; Varnek, A. Benchmarking of Linear and Nonlinear Approaches for Quantitative Structure-Property Relationship Studies of Metal Complexation with Ionophores. J. Chem. Inf. Model., 2006, 46, No. 2, 808-819.
  15. Katritzky, A. R.; Dobchev, D. A.; Fara, D. C.; Hur, E.; Tamm, K.; Kurunczi, L.; Karelson, M.; Varnek, A.; Solov’ev, V. P. Skin Permeation Rate as a Function of Chemical Structure. J. Med. Chem., 2006, 49, No. 11, 3305-3314.
  16. Katritzky, A. R.; Kuanar, M.; Slavov, S.; Dobchev, D. A.; Fara, D. C.; Karelson, M.; William, E.; Acree, W. E. Jr.; Solov’ev, V. P.; Varnek, A. Correlation of Blood — Brain Penetration Using Structural Descriptors. Bioorg. Med. Chem., 2006, 14, No. 14, 4888-4917.
  17. Solov’ev, V. P.; Kireeva, N. V.; Tsivadze, A. Yu.; Varnek, A. A. Structure-Property Modeling of the Complexation of Strontium with Organic Ligands in Water. Zh. Structur. Khimii (Rus.), 2006, 47, No. 2, 303-317.
  18. Varnek, A.; Fourches, D.; Sieffert, N.; Solov’ev, V. P.; Hill, C.; Lecomte, M. QSPR Modeling of the AmIII / EuIII Separation Factor: How Far Can We Predict? Solv. Extr. Ion Exch., 2007, 25, No. 1, P. 1-26.
  19. Varnek, A.; Kireeva, N.; Tetko, I. V.; Baskin, I. I.; Solov’ev, V. P. Exhaustive QSPR Studies of Large Diverse Set of Ionic Liquids: How Accurately Can We Predict the Melting Point? J. Chem. Inf. Model., 2007, 47, No. 3, P. 1111-1122.
  20. Horvath D., Bonachera F., Solov’ev V., Gaudin C., Varnek A. Stochastic versus Stepwise Strategies for Quantitative Structure — Activity Relationship Generations. — How Much Effort May the Mining for Successful QSAR Models Take? J. Chem. Inf. Model., 2007, 47, No. 3, P. 927-939.
  21. Varnek A.; Fourches D.; Solov’ev V.; Klimchuk O.; Ouadi A.; Billard I. Successful «In Silico» Design of New Efficient Uranyl Binders. Solv. Extr. Ion Exch., 2007, 25, No. 4, P. 433-462.
  22. Varnek A., Fourches D., Horvath D., Klimchuk O., Gaudin С., Vayer P., Solov’ev V., Hoonakker F., Tetko I. V., Marcou G. ISIDA — Platform for Virtual Screening Based on Fragment and Pharmacophoric Descriptors. Cur. Computer-Aided Drug Design, 2008, 4, No. 3, P. 191-198.
  23. Varnek A., Fourches D., Kireeva N., Klimchuk O., Marcou G., Tsivadze A., Solov’ev V. Computer-Aided Design of New Metal Binders. Radiochim. Acta, 2008, 96, P. 505-511.