导语


对于不同风格的艺术作品,人们的主观偏好不尽相同。然而其背后的逻辑,却能够使用客观的高层及低层特征加以描述和解释。


这是加州理工的科研团队在Nature Human Behaviour 5月20日的论文[1]得出的出人意料的结论。

郭瑞东 | 编译作者

 brainnews | 来源


原文题目:

Aesthetic preference for art can be predicted from a mixture of low- and high-level visual features

原文地址:

https://www.nature.com/articles/s41562-021-01124-6


尽管萝卜白菜各有所爱,每个人偏爱的艺术风格会有所不同,但是对视觉艺术品的欣赏都是人生体验中不可或缺的一部分。正如哲学家康德所说,艺术本身是客观且普世的,有些艺术品就是能够跨越时空,获得大多数人的喜爱。


但一方面艺术是普世的,一方面艺术鉴赏又是因人而异的,这样就引出了如下问题:为什么人们都能够发现优秀作品的美?是否存在某些特征,不论个体的审美偏好,都能让大脑觉得“美”?(相关阅读:大脑中存在美的加工中心吗?


为了回答这一问题,实验人员分别邀请1359名受试者,使用亚马逊众包平台,对随机抽取的、包含各种艺术风格的60幅绘画作品进行打分;以及7名受试者,在实验室中对1001幅绘画进行打分。


随后,研究者将绘画替换为716幅摄影作品,重复了上述实验,发现无论在绘画或摄影这两种场景下,线性特征累积模型(Linear feature summation,LFS)都能够基于深度学习提取的高层(色调对比度,饱和度)及低层(灰度、明度、饱和度)特征。


通过线性累加,预测受试者的审美偏好的打分。由于预测模型使用的特征,对照片和图片两种不同来源的数据都适用,故此作者指出视觉审美过程中使用的特征,与审美对象本身无关,而是跨越艺术品风格通用。



可基于色调,对比度,饱和度等低层特征,以及明亮程度,具象等高层特征预测对艺术品的审美偏好


通过聚类分析,将对受试者进行在线分析,可分为三类,如下图所示。其中占比最多的蓝点,表示这些受试者偏好风景画和印象派的作品;红点代表偏好有冲击力或有动感的作品,例如立体派cubism);而第三类则喜欢不那么描摹实物,差异比较大的抽象派艺术品。


对在线受试者的艺术偏好的聚类图展示了人们关注的特征主要呈现在具象性,动感及变化大小三个维度

 

不同聚类对应的图片特征间的相关性热图,可以看出与每一种审美类型最相关的类型对应的特征


2017年,Nature neuroscience 上曾发表过一篇类似的研究[2]。该文从大脑功能核磁影像数据出发,研究人类如何产生对食物的偏好,并发现大脑是根据食物中碳水,蛋白质,脂肪的占比来对食物进行打分,从而产生不同的偏好。


研究者据此开发出模型,通过fMRI数据预测不同人对不同食物的评分。然而,艺术品比食物的复杂度高出许多,其可能的变化也更多,这使得找到影响艺术品鉴赏力的因素更具有挑战。


为此,研究者使用能模拟大脑处理视觉信号的模型,从艺术品中提取视觉特征。认知神经科学已经证明,用于图像识别的深度卷积网络,作为最常用的深度学习模型,其层次化的处理流程,和大脑中的视觉皮层,有相近之处。而该研究所使用的VGG16,常用于图像识别,包含13个卷积层和两个全连接层,从而可用于进行图像识别的ImageNet训练。


卷积神经网络中,层数越深,特征越抽象。因此对于低层特征,例如色调、平均饱和度、基于较低层神经网络得出特征做的预测,其准确性更高;而对于高层特征,例如绘画是否有动感、是否描摹实物,则需要使用更深的神经网络提取特征,才能达到更高的预测准确性。如下图所示。


使用不同深度的神经网络,以及不同类型的特征,预测审美偏好的准确度的折线图


这可以说明两点,一是打破通常以为的“深度学习模型是一个不可解释的黑箱”这一认识:意味着可以用卷积神经网络中的计算复杂度,估计大脑从艺术品中抽取特征时的计算复杂度。


二是指出,虽然神经网络越深,预测准确性越高,但这不意味着艺术审美的偏好,只取决于高层特征。使用众多低沉特征的线性组合,同样可以得到相近的预测精度。


需要指出的是,深度神经网络中的连接只包含前馈过程,只能从低层到高层,而大脑中的连接,普遍包含递归结构。这意味着相比该研究使用的深度卷积网络,循环神经网络中特有的时序处理模块,可能对大脑对视觉信号的处理更精确。





总  结




总的来说,该研究借助深度学习,论证了个体对艺术品的主观感受,其实可以看成是大脑基于客观特征执行的一个函数。尽管这个函数很复杂,诸如注意力的分配、背景记忆和环境等因素都可能对其产生影响;但我们仍能够通过部分特征预测个体眼中的艺术品的美学价值。


以此类推,这样的研究方法,不仅可以研究人类的审美偏好,也可以帮助我们理解所谓“心智的免疫系统”—— 厌恶情绪:通过找出让人感到厌恶的图片中的各种特征,便可删繁就简地分析这些图片招致个体产生厌恶情绪的原因,以及不同性格的人对厌恶情绪理解的差异等等。


本研究也存在一些局限。例如,从网上招募的受试者,无法区分是否受过专业的艺术品鉴赏训练;因此也就无法区分受过训练的大脑和普通大脑在欣赏艺术时是否会选取不同的特征。并且,在鉴赏某一特定艺术风格的作品和多种风格的作品时,人们也可能表现出不同的审美偏好和特征提取模式。


参考文献:

1. Aesthetic preference for art can be predicted from a mixture of low- and high-level visual features.Nat Hum Behav . 2021 May 20.2. Elucidating the 2.underlying components of food valuation in the human orbitofrontal cortex. Nat Neurosci . 2017 Dec;20(12):1780-1786.



复杂科学最新论文


集智斑图顶刊论文速递栏目上线以来,持续收录来自Nature、Science等顶刊的最新论文,追踪复杂系统、网络科学、计算社会科学等领域的前沿进展。现在正式推出订阅功能,每周通过微信服务号「集智斑图」推送论文信息。扫描下方二维码即可一键订阅:



推荐阅读



点击“阅读原文”,追踪复杂科学顶刊论文