Нейромережа навчилася створювати складні зображення по текстовому опису

: Ірина Ковальчук; Технології; 20 червня 2019

Інженери з Microsoft представили нейромережу, здатну створювати складні зображення по текстовому опису, яка працює краще алгоритмів, представлених до сих пір. Опис розробки опубліковано на arxiv.org.

Всі свіжі новини на нашому Telegram-каналі Приєднуйся!

Дослідники розробили генеративно-змагальну нейромережу, яка дуже схожа на представлений раніше Microsoft алгоритм AttGAN. Відмінність полягає в тому, що нова нейромережа при створенні зображень на основі тексту орієнтується на об'єкти — іншими словами, вона аналізує потрібний текст та розкладає об'єкти з бібліотеки на готовому зображенні.

Алгоритм навчався на 328 тис. об'єктах з текстовим описом, зібраних в датасеті COCO.

У дослідженні говориться, що представлена нейромережа краще за інших алгоритмів справляється зі створенням по текстовому опису складних об'єктів, в яких міститься безліч дрібних деталей.