Аниме, киберпанк и дом в облаках: нейросеть «Алиса» научилась переделывать фото в разных стилях
Нейросеть «Алиса» теперь умеет изменять стиль картинки. Пользователи смогут не только создавать изображения с ее помощью, но и перерисовывать личные фотографии, иллюстрации из интернета или сгенерированные ранее рисунки. В чате «Алиса» поможет создать уникальный аватар в стиле любимого мультфильма, контент для тематического блога или необычное изображение, которым можно поделиться с друзьями. Об этом CNews сообщили представители «Яндекса».
Подобрать стиль изображения можно двумя способами: текстовым запросом с описанием идеи или в меню с готовыми стилями. Среди них, например, аниме, киберпанк и варианты по мотивам популярных анимационных вселенных. При загрузке фото меню со стилями появится над строкой запроса, а при изменении сгенерированного ранее изображения — под ним.
Технология изменения стиля работает на модели YandexART 2.5. Задачу для неё формулирует нейросеть «Алиса» — она анализирует запрос пользователя и исходное изображение с помощью визуально-языковой модели «Яндекса» (VLM), а затем подбирает технические параметры для генерации. Так, если написать «Алисе» в чате «нарисуй в стиле Миядзаки» или «стилизуй как в “Ходячем замке”», она поймет, о чем идет речь, и создаст соответствующую картинку. А чтобы нейросеть точнее понимала запросы и подбирала оформление, ее дообучили на примерах настроек и описаний стилей.
