МТУСИ: Алгоритм для генерации изображений нейросетями

Продукт
Название базовой системы (платформы): Искусственный интеллект (ИИ, Artificial intelligence, AI)
Разработчики: Московский технический университет связи и информатики (МТУСИ)
Дата премьеры системы: 2024/01/29

Основная статья: Нейросети (нейронные сети)

2024: Создание алгоритма для генерации изображений нейросетями

В МТУСИ разработали алгоритм для генерации изображений нейросетями. Об этом университет сообщил 29 января 2024 года.

Почти во всех сферах жизни человека все большее внедрение находят методы машинного обучения. При этом одними из самых эффективных и часто используемых на практике являются методы, базирующиеся на искусственных нейронных сетях (НС). Они позволяют обрабатывать изображения, видео- и аудиоданные.

Еще одним направлением развития НС является генерация текста и изображений по составленному пользователем запросу (промпту). НС научились создавать изображения, которые трудно отличить от реальных, созданных человеком, поэтому стали мощным рабочим инструментом при составлении рекламных слоганов, создании необычных рекламных баннеров. Метавселенная ВДНХ 4.4 т Вследствие этого задача разработки алгоритма формирования запроса, позволяющего сгенерировать качественное изображение в разумные временные интервалы, становится особо актуальной. Сотрудники кафедры «Математическая кибернетика и информационные технологии» МТУСИ смогли ее решить.

«
При разработке алгоритма составления промптов, позволяющих получить качественное изображение нейросетевыми онлайн-сервисами, определены факторы, приводящие к некорректным результатам генерации изображений посредством естественно-языковых, неформализованных запросов. Создана методика описания объекта, явления или процесса, для апробации разработанного алгоритма и определения его эффективности выбраны нейросетевые онлайн-сервисы «Шедеврум» и Kandinsky, — пояснил д.т.н., профессор кафедры МКиИТ МТУСИ Юрий Леохин.
»

Выбор НС определяется тем, что они являются отечественными разработками, которые ориентированы в первую очередь на русскоязычную аудиторию.

«
Результаты проведенных экспериментов показали, что разработанный алгоритм формирования запроса к нейросетевым сервисам для генерации изображения позволяет получать более корректный результат по сравнению с обычным естественно-языковым запросом. Особенно это заметно на запросах, содержащих отрицательные частицы и предлоги, относительные прилагательные, предполагающие представление абстрактного понятия, и при использовании числительных, — отметил к.т.н., доцент кафедры МКиИТ МТУСИ Тимур Фатхулин.
»

В дальнейшем ученые планирует модифицировать и модернизировать разработанный алгоритм с учетом увеличивающегося функционала нейросетевых сервисов и рассмотреть возможность его применения для генерации текстового контента.