Інженери з Microsoft представили нейромережу, здатну створювати складні зображення по текстовому опису, яка працює краще алгоритмів, представлених до сих пір. Опис розробки опубліковано на arxiv.org.
Дослідники розробили генеративно-змагальну нейромережу, яка дуже схожа на представлений раніше Microsoft алгоритм AttGAN. Відмінність полягає в тому, що нова нейромережа при створенні зображень на основі тексту орієнтується на об'єкти — іншими словами, вона аналізує потрібний текст та розкладає об'єкти з бібліотеки на готовому зображенні.
Алгоритм навчався на 328 тис. об'єктах з текстовим описом, зібраних в датасеті COCO.

У дослідженні говориться, що представлена нейромережа краще за інших алгоритмів справляється зі створенням по текстовому опису складних об'єктів, в яких міститься безліч дрібних деталей.