Сбер представил новую версию генеративной модели в начале апреля и она сразу стала одним из самых быстрорастущих ИИ-сервисов в мире. Количество уникальных пользователей в 1 млн было достигнуто всего за 4 дня с момента запуска и еще за два дня этот показатель был удвоен до 2 млн.
Российские разработчики смогли представить мощное универсальное решение для широкого круга задач на уровне лучших мировых аналогов. Kandinsky 2.1 включили в топ-5 трендов мировых репозиториев по версии GitHub. Каждый пользователь может задействовать нейросеть для своих собственных задач — сервис находится в открытом бесплатном доступе: Telegram-бот или на сайте.
Запрос со словами «Девушка в Кыргызстане».
Kandinsky 2.1 от «Сбера» — это обновленная модель, которая унаследовала веса предыдущей версии, обученной на 1 млрд пар «текст — изображение». Дополнительно модель дообучали на датасете из 2 млн пар качественных изображений — картинки с описаниями в таких традиционно сложных для нейросетей областях, как тексты и лица людей. Обновленная нейросеть кардинально улучшило генерацию изображений в высоком разрешении и содержит 3,3 млрд параметров вместо 2 млрд в Kandinsky 2.0.
По качеству генерации изображений российская модель ничем не отличается от своих прямых конкурентов Midjourney, Stable Diffusion и DALL-E. Напротив, российская модель имеет существенное преимущество — она способна понимать более 100 языков, включая русский, а также хорошо понимает запросы, которые содержат культурные особенности стран нашего континента.
Нейросеть разработали и обучили исследователи Sber AI при партнерской поддержке ученых из Института искусственного интеллекта AIRI на объединенном датасете Sber AI и компании SberDevices. Всего за неделю на сервисе было сгенерировано свыше 10 млн изображений.
Чтобы сделать изображение, необходимо добавить текстовое описание своего запроса. Далее нажимаем на кнопку «Создать», выбираем подходящий стиль генерации и получаем результат. Кроме того, можно загрузить свою картинку, указав на то, как ее требуется обработать. Если задать описание изображения и менять стили, нейросеть каждый раз будет генерировать новые результаты. Получившееся изображение можно редактировать — обрезать нужную область, стереть часть картинки ластиком — или скачать. Интерфейс достаточно интуитивен и прост в своем использовании.
Дружба России и Кыргызстана всегда была главной ценностью во взаимодействие наших стран и народов, отмечают разработчики нейросети. Успехи российских инженеров всегда воспринимались как общие победы, поскольку достижения технологического суверенитета, в том числе в сфере Al, идут на благо национальных экономик. Кроме того, это сигнал западу об усилении конкуренции наших стран на международной арене. Немаловажно, что в развитии технологических сервисов во внимание приняты взаимное уважение к культурным особенностям наших народов.