人工智能(AI)在生成逼真图像方面越来越出色,但它在画手方面存在一个明显的弱点。我们经常看到AI生成的手要么扭曲成奇怪的形状,要么多了或少了几根手指,给人一种极不舒服的感觉。那么为什么会出现这种情况呢?
人的手是非常复杂的。手是人体的一个复杂部位,它有五个手指,包含许多不同的骨骼和肌肉,每个手指看起来都不尽相同。与人脸相比,手在不同角度看起来差异很大。比如,当一个人拿着雨伞时,手会蜷缩起来;当同一个人手里拿着一个大碗时,手的形状又完全不同;如果手捏成拳头,手指甚至完全看不见。
事实上,不仅是AI画不好手,对于人类来说,画好手也并非易事。学过绘画的人都知道,画手是一个难点。手的形状是固定的。当AI生成一棵树时,叶子的数量可以是任意的,但这并不重要,因为没有人会在意到底有多少片叶子。但是,如果是一只有7或9个手指的手,人们会立刻注意到。
此外,AI并不真正理解手的概念。AI只能了解事物的外观,而无法理解其内在的工作原理。因此,AI并不真正理解手的概念,它只是在模仿而已。在训练AI时,我们只是向其提供了大量的图像,其中一些图像显示了五个手指,而其他一些可能显示了四个手指,甚至可能没有显示手指。AI无法从这些图像中理解手的三维结构。与其他身体部位相比,手在这些图像中出现的机会相当少。AI也并不真正了解手与人体的连接方式。
另外,手在图像中所占的空间往往较小,提供的信息相对较少。从稳定扩散(Stable Diffusion)的训练过程来看,图像逐步加入噪点,而AI的学习过程与此相反,是从噪点中逐步恢复原图。因此,在画面中占据很小空间的手,在一堆噪点中恢复出如此复杂的手自然是非常困难的。
从这个角度来看,所谓AI是拼凑艺术家作品的说法并不准确,实际上,AI是在混沌中寻找秩序。