Израильские ученые создали нейросеть, которая воссоздала изображение блюда, опираясь на его описание, которое не содержало четких данных о визуальных признаках.
Эксперты использовали 52 тысячи пар рецептов и фотографий, чтобы добиться эффекта.
В общей сложности исследователи создали три нейросетевые модели различной архитектуры для трех главных подзадач. Одна предсказывает движения животного, основываясь на предыдущих. Вторая планирует движения, а третья — классифицирует объекты в кадре и определяет зоны, где собака может перемещаться.