Системы искусственного интеллекта до сих пор не научились правильно изображать руки людей. И вот почему

В этом году искусственный интеллект создал такие вещи, которые побеждали на художественных конкурсах. Он смог даже сдать экзамены по юриспруденции. Но его слабое место - это точное изображение человеческих рук.

Несмотря на всю работу, которую провели специалисты над генераторами изображений ИИ, они всё ещё не могут точно воссоздать руки людей. В центре внимания эта проблема оказалась после появления коллекции изображений пользователя Twitter, которая была созданна генератором ИИ Midjourney.

С одной стороны, изображения вышли очень реалистичными. С другой же - на них у кого-то три руки, у кого-то семь пальцев и очень длинная ладонь и т.п.

Так почему же такой простой объект, как руки, искусственный интеллект не может изобразить как надо? Как отмечает профессор Питер Бентли, учёный-компьютерщик из Университетского колледжа Лондона, генераторы 2D-изображений не имеют понятия о трёхмерной геометрии чего-либо вроде руки. То есть общее представление они улавливают, но ни одна из подобных моделей не имеет представления о том, что это такое.

Dall-E 2

У систем искусственного интеллекта просто нет никакого контекста для создания правильных рук на изображении. Кроме того, они не способны учитывать контекст изображения и не знают вообще, как это делать. Фактически они просто комбинируют всё, что у них есть, говорит учёный.

Постепенно нейросети, однако обучаются трёхмерной геометрии. Это позволит им создавать более сложные изображения. Поэтому в будущем всё ещё может в этом плане измениться. Более того, это может привести к созданию высокодетализированных 3D-объектов и даже цифровых миров.