Группа исследователей из России представила инструмент, который на основе больших языковых моделей позволяет улучшать хранилища открытого научного кода, делая их более удобными для использования другими научными коллективами. Пресс-служба Университета ИТМО в Санкт-Петербурге сообщила, что новая разработка направлена на повышение удобства работы с научными данными и их доступность для широкого круга исследователей.
Этот инструмент был создан в рамках проекта, руководимым доцентом ИТМО Николаем Никитиным, который также возглавляет группу научно-технического развития исследовательского центра "Сильный ИИ в промышленности". Ученые разработали мультиагентную систему, использующую большие языковые модели для различных задач, таких как создание документации, тестирование и анализ кода, а также подготовка отчетов о необходимости доработок. Основная цель инструмента — автоматизация работы с научным кодом, что значительно ускоряет и упрощает процесс.
Ученые отметили, что их разработка не ограничивается конкретными системами ИИ. В инструменте предусмотрена возможность выбора моделей, таких как GPT-4, LLaMA, GigaChat и другие, в зависимости от доступных у пользователя ресурсов. Это дает исследователям свободу выбора и позволяет гибко подходить к выполнению задач, связанных с обработкой научных данных и улучшением качества кода.
Проект уже прошел несколько тестов, в том числе на проектах исследовательских команд из ИТМО и международных коллег из Бразилии. В частности, с помощью нового инструмента была проверена функция автоматического перевода названий файлов и папок на английский язык, что сделает открытый научный код доступным для международного сообщества. В будущем ученые планируют расширить функционал системы, чтобы она могла решать более сложные задачи разработки научных проектов, улучшая качество кода и снижая требования к его исходной готовности.