Ученые из Массачусетского технологического института (MIT) совместно с лабораторией MIT-IBM Watson представили новую инновационную систему искусственного интеллекта, способную создавать молекулы по обычному текстовому запросу. Новая система, получившая название Llamole (Large Language Model for Molecular Discovery), сочетает в себе возможности языковых моделей, таких как ChatGPT, и графовых нейронных сетей, что позволяет ей более эффективно работать с химическими структурами.
Создание новых молекул является важным этапом в разработке лекарств и новых материалов, однако этот процесс обычно требует значительных временных и вычислительных затрат. Языковые модели, такие как те, что используются в современных чат-ботах, хорошо обрабатывают текстовую информацию, но плохо справляются с задачами, связанными с химией, поскольку молекулы представляют собой графы, а не последовательности слов. Специализированные графовые модели, в свою очередь, имеют свои ограничения: они не понимают текст и требуют сложных входных данных. Именно поэтому ученые из MIT решили объединить эти два подхода в единую систему.
Система Llamole принимает на вход текстовый запрос, например, описание молекулы с определенными свойствами, такими как "молекула, проникающая через гематоэнцефалический барьер и подавляющая ВИЧ, с молекулярной массой 209". После этого система чередует работу языковой модели и графовых модулей, чтобы создать молекулу, подробно объяснить, как она устроена, и предложить пошаговый план её синтеза. Уникальной особенностью этого подхода является использование "триггерных токенов", которые помогают системе понять, когда необходимо подключить соответствующий модуль. Все элементы системы взаимодействуют друг с другом, создавая замкнутый цикл, в котором каждый модуль понимает действия других.
Результаты экспериментов показали, что система Llamole способна создавать более качественные молекулы, а также улучшает точность планирования синтеза с 5% до 35%. Это является значительным достижением, так как система работает эффективнее даже более крупных языковых моделей, которые в десять раз мощнее по своим вычислительным возможностям. Это открытие может оказать значительное влияние на процессы разработки новых лекарств и материалов, предоставив исследователям мощный инструмент для быстрого и точного создания молекул с нужными свойствами.