07:47
Пробки:   6
$
80.2237
90.3821

Microsoft научила нейросеть рисовать сложные сцены по текстовому описанию

28 июня 2019
5798
2 мин.
Microsoft научила нейросеть рисовать сложные сцены по текстовому описанию

Исследовательская группа Microsoft Research представила генеративно-состязательную нейросеть, которая способна генерировать изображения с несколькими объектами на основе текстового описания. В отличие от более ранних подобных алгоритмов text-to-image, способных воспроизводить изображения только базовых объектов, эта нейросеть может справляться со сложными описаниями более качественно.

Сложность создания подобного алгоритма заключалась в том, что, во-первых, ранее бот был не способен в хорошем качестве воссоздавать все базовые объекты по их описаниям, и, во-вторых, не мог проанализировать то, как несколько объектов могут относиться друг к другу в рамках одной композиции. К примеру, чтобы создать изображение по описанию «Женщина в шлеме сидит на лошади», нейросеть должна была семантически «понять», как каждый из объектов относится друг к другу. Эти проблемы удалось решить, обучив нейросеть на основе открытого дата-сета COCO, содержащего разметку и данные сегментации для более 1,5 млн объектов.

В основе алгоритма лежит объектно-ориентированная генеративно-состязательная нейросеть ObjGAN (Object-driven Attentive Generative Adversarial Newtorks). Она анализирует текст, выделяя из него слова-объекты, которые необходимо расположить на изображении. В отличие от обычной генеративно-состязательной сети, состоящей из одного генератора, который создает изображения, и одного дискриминатора, который оценивает качество сгенерированных изображений, ObjGAN содержит два различных дискриминатора. Один анализирует, насколько реалистичен каждый из воспроизведенных объектов и насколько он соответствует имеющемуся описанию. Второй определяет, насколько вся композиция реалистична и соотносится с текстом.

Предшественником алгоритма ObjGAN стал AttnGAN, также разработанный исследователями Microsoft. Он способен генерировать изображения объектов по более простым текстовым описаниям. Технология преобразования текста в изображения может применяться для помощи дизайнерам и художникам в создании эскизов.

Алгоритм ObjGAN находится в открытом доступе на GitHub.

Метки

Пресс-релизы компании

Кинокомпания Тимура Бекмамбетова Bazelevs и Microsoft договорились о стратегическом сотрудничестве в сфере цифровизации кинопроизводства. Соответствующий документ был подписан сторонами в лице Тимура Бекмамбетова и Кристины Тихоновой, президента Microsoft в России. Соглашение предполагает сотрудничество в использовании облачных технологий Microsoft Azure и искусственного интеллекта в процесс...
15 октября 2019
Разработчик ИИ-решений Sarafan Technology Inc., партнер Microsoft, представил не имеющий аналогов в России сервис по поиску предметов интерьера на фото и видео. Первым эксклюзивным медиапартнером интеллектуального сервиса стал бренд «Домашний о...
29 августа 2019
Компания Microsoft выпустила обновления безопасности для следующих продуктов: Windows, Windows Server, Microsoft Edge, Internet Explorer, Office, SharePoint Server, SQL Server, Visual Studio, Team Foundation Server, Azure DevOps Server, Dynamics CRM/...
17 мая 2019
Команда Xbox Россия и онлайн-кинотеатр Okko объявили о выпуске приложения Okko для Xbox One. Пользователи Xbox получат доступ ко всем возможностям сервиса, включая просмотр на любых устройствах под одной учетной записью, возможность приобретать не то...
23 апреля 2019
Виджеты нативной рекламы от компании Sarafan Technology Inc. стали доступны для всех участников облачной экосистемы Microsoft на платформах AppSource и Azure Marketplace. Медиаплощадки и онлайн-издания могут оставить заявку на их бесплатное подключен...
19 марта 2019
Команда Xbox поделилась списком игр, которые присоединятся к постоянно растущему каталогу Xbox Game Pass в ближайшее время. В марте все подписчики сервиса получат доступ к следующим проектам: Just Cause 4 (Уже доступна) Это птица? Это самолет? ...
7 марта 2019

Свежие пресс-релизы

Некоторые дата-центры все еще придерживаются традиционного подхода к организации инфраструктуры в области информационных технологий. Но в таком случае каждый ее элемент требует индивидуальной настройки и управления. Благодаря развитию современных тех...
Современные беспроводные эхолоты работают даже в условиях полной автономии. Разбираемся, как именно функционирует такая техника и почему это особенно важно летом. Летняя рыбалка — это не только лодки и навигаторы, но и поездки на небольшие вод...
Продолжается разработка операционной системы Simply Linux от «Базальт СПО» на Одиннадцатой платформе, релиз ожидается в 2025 году. В новой версии обновятся графическая среда и пользовательские приложения, появится программа PortProton для запуска популярных Windows-игр, будут улучшены звук и графика. Графическая среда Xfce 4.20 Графическая среда Xfce обновлена до актуальной версии 4....
Оператор запускает собственную цифровую платформу для работы с поставщиками. Новый сервис предназначен для развития системы закупок оборудования, комплектующих и услуг, а также оптимизации взаимодействия с контрагентами. Кроме того, решение позволит ...
15 мая 2025
Финансовые агрегаторы — это онлайн-платформы, которые позволяют пользователям сравнивать и выбирать банковские, страховые и лизинговые продукты. Они стали важным элементом цифровизации финансового рынка, меняя традиционные бизнес-модели, усиливая конкуренцию и влияя на поведение клиентов. Рассмотрим их воздействие на каждый из этих секторов. Банковский сектор Такие агрегаторы, как «С...
Лучшие пресс-службы
Новостей: 754
Новостей: 118
Новостей: 114
Новостей: 97
Новостей: 95
Новостей: 82
Новостей: 81
Новостей: 78

ПРЕСС-РЕЛИЗЫ САНКТ-ПЕТЕРБУРГА


Пресс-релизы Глобал78.ру – это актуальные новости от санкт-петербургских компаний.
На ресурсе регулярно публикуются официальные пресс-релизы компаний Санкт-Петербурга и Ленинградской области. Узнать самые свежие новости предприятий можно в соответствующем разделе на главной странице. Размещение пресс-релизов — традиционный и действенный способ продвижения вашего бизнеса. Он позволяет организациям заявить о себе и своих товарах и услугах максимально широкой массе аудитории. При этом информационный повод может быть любым: привлечение людей на мероприятие или конференцию, освещение новых товаров или кадровые назначения. Если вы ставите цель привлечь внимание к своей информации, то Глобал78.ру станет вашим надежным помощником в данном деле. Благодаря порталу ваш пресс-релиз увидят обозреватели ведущих интернет-изданий, клиенты и партнеры.
Глобал78.ру дает возможности представителям компаний и организаций в Санкт-Петербурге и Ленинградской области самостоятельно разместить пресс-релиз при регистрации на ресурсе. Самая главная особенность Глобал78.ру в том, что все публикации санкт-петербургских компаний попадают в архивы и будут доступны из поиска длительное время. Вам достаточно лишь добавить пресс-релиз в информационную ленту.
Глобал78.ру предлагает своим клиентам абонементское обслуживание, которое позволяет компаниям регулярно публиковать пресс-релизы на выгодных условиях. Кроме того, бизнес портал дает возможность более полно рассказать о жизни компании благодаря добавлению фото и видеоматериалов, персон и цитат сотрудников. Все информационные материалы обладают активными ссылками и приведут потенциальных клиентов на ваш ресурс.
Потапова Алёна

Директор по развитию
Население
8211647533
Умерли за год
22508131
Родились за год
55373986