Loading...

Ученые создали новый метод прогнозирования важного свойства органических молекул — фактора биоконцентрации. Он основан на классических моделях физико-химических взаимодействий растворителя с растворяемым веществом и современных методах машинного обучения и позволяет предсказывать сложные свойства веществ, используя минимальный набор исходных данных. Результаты исследования опубликованы в журнале Journal of Physics: Condensed Matter.

Фактор биоконцентрации характеризует степень накопления вещества в живых организмах, это одно из важнейших свойств органических веществ, которые используются при оценке безопасности того или иного химического соединения. Оценить этот параметр на практике можно, например, так. Нужно добавить исследуемое вещество в емкость с живой рыбой и спустя некоторое время измерить его концентрацию в рыбе и в окружающей воде. Однако оценить эту величину чисто теоретически, без проведения дополнительных экспериментов, оказывается весьма трудно.

Первый способ — это сгенерировать множество параметров (дескрипторов), описывающих молекулы, и построить на основе этих данных математическую модель. Модель может получиться точной, но плохо интерпретируемой — за счет большого числа параметров. Однако еще хуже то, что для соединений, которые слишком сильно отличаются от представленных в обучающей выборке, модель может работать плохо. Второй подход основан на молекулярной теории жидкости, которая описывает поведение веществ в растворах. Однако так как биоконцентрация — это сложный параметр, зависящий от множества факторов, то используя физико-химическую теорию напрямую, предсказать биоконцентрацию тоже не получится.

Ученые из Сколковского института науки и технологий, Университета Тарту (Эстония) и Университета Стратклайда (Великобритания) под руководством профессора Сколтеха Максима Федорова разработали гибридный метод предсказания фактора биоконцентрации. Cначала они проводят физико-химические расчеты, на основе которых определяют трехмерные плотности водорода и кислорода вокруг изучаемой молекулы, а потом применяют к этим данным трехмерные сверточные нейронные сети, технологию, которая уже успешно используется для распознавания изображений. Новый подход демонстрирует, что для описания сложных свойств органических веществ достаточно небольшого объема исходной информации.

«Разработанный нами метод позволит существенно упростить прогнозирование экологической нагрузки от того или иного вещества, — рассказывает первый автор статьи Сергей Соснин из Сколтеха. — Но самое главное в нашей работе — это то, что мы разработали универсальный способ описания молекулы для передачи ее "образа" в трехмерную сверточную нейронную сеть. В перспективе наши разработки позволят прогнозировать свойства различных экзотических молекул и принципиально новых соединений, для которых существующие методы поиска соотношений структура—свойство неприменимы».


Подписывайтесь на InScience.News в социальных сетях: ВКонтакте, Telegram, Одноклассники.