В России разработан инструмент для оптимизации научных хранилищ кода

Группа исследователей из России представила инструмент, который на основе больших языковых моделей позволяет улучшать хранилища открытого научного кода, делая их более удобными для использования другими научными коллективами. Пресс-служба Университета ИТМО в Санкт-Петербурге сообщила, что новая разработка направлена на повышение удобства работы с научными данными и их доступность для широкого круга исследователей.

Этот инструмент был создан в рамках проекта, руководимым доцентом ИТМО Николаем Никитиным, который также возглавляет группу научно-технического развития исследовательского центра "Сильный ИИ в промышленности". Ученые разработали мультиагентную систему, использующую большие языковые модели для различных задач, таких как создание документации, тестирование и анализ кода, а также подготовка отчетов о необходимости доработок. Основная цель инструмента — автоматизация работы с научным кодом, что значительно ускоряет и упрощает процесс.

Ученые отметили, что их разработка не ограничивается конкретными системами ИИ. В инструменте предусмотрена возможность выбора моделей, таких как GPT-4, LLaMA, GigaChat и другие, в зависимости от доступных у пользователя ресурсов. Это дает исследователям свободу выбора и позволяет гибко подходить к выполнению задач, связанных с обработкой научных данных и улучшением качества кода.

Проект уже прошел несколько тестов, в том числе на проектах исследовательских команд из ИТМО и международных коллег из Бразилии. В частности, с помощью нового инструмента была проверена функция автоматического перевода названий файлов и папок на английский язык, что сделает открытый научный код доступным для международного сообщества. В будущем ученые планируют расширить функционал системы, чтобы она могла решать более сложные задачи разработки научных проектов, улучшая качество кода и снижая требования к его исходной готовности.