Команда СберБанка разработала обновленную версию нейросети, которую презентовала на конференции AI Journey, посвященной искусственному интеллекту и машинному обучению, которая проходит с 22 по 24 ноября.
СберБанк представил новую версию Kandinsky 3.0 с лозунгом «Высокое искусство вашими руками». Согласно разработчикам, обновленная модель обладает лучшим пониманием текстовых запросов пользователей. Нейросеть теперь способна создавать ещё более реалистичные изображения, полноценные художественные картины и даже арты с использованием скетчей.
Kandinsky 3.0 обладает лучшим пониманием и восприятием русской культуры по сравнению с предыдущими версиями. Теперь модель генерирует высококачественные изображения известных российских и советских личностей, архитектурных достопримечательностей, культурных объектов и объекты народного искусства России, таких как гжельская роспись. Кроме того, новая версия предлагает улучшенную функцию редактирования изображений и возможность их дорисовки на бесконечном полотне (inpainting и outpainting).
Kandinsky 3.0 предоставляет изображения высокого качества с большим разрешением 1024 x 1024 пикселя, и может адаптироваться к различным соотношениям сторон. Разработчики обучили эту версию нейронной сети на большом наборе данных, содержащем 1,5 миллиарда сопоставлений текст-изображение. Этот набор данных был тщательно отфильтрован, что существенно повысило качество генерируемых изображений.
Пользователи Kandinsky 3.0 имеют возможность создавать анимированные видеоролики на основе текстовых описаний. При каждом запросе система генерирует видео продолжительностью в четыре секунды с выбранным эффектом анимации, частотой 24 кадра в секунду и разрешением 640×640 пикселей.
Kandinsky 3.0 обладает многоязыковыми навыками и может понимать запросы на более чем 100 языках. Пользователи имеют возможность создавать изображения в широком спектре стилей без ограничений. Для оценки возможностей нейросети доступны следующие платформы: fusionbrain.ai, Telegram-боты, VK-боты и rudalle.ru. Модель также доступна через сервис GigaChat, приложения СберБанк Онлайн и Салют, а также на умных устройствах Sber по голосовой команде «Запусти художника». Чтобы сгенерировать анимированные видеоролики, можно оставить заявку на доступ через Telegram-бот.