导语


在科学家、艺术家的职业生涯中,短时间内集中产出高质量作品是相当普遍的现象。创造性活动复杂而充满偶然性,可是“巅峰期”的出现或许有规律可循。9月13日,美国西北大学王大顺团队在 Nature Communications 发表论文,分析了艺术家、电影导演和科学家的职业生涯,用深度学习和网络科学方法构建他们创作成果的高维表征。结果发现,先在不同方向创意探索,再在特定领域专注开发利用的做法与巅峰期的到来密切相关。


研究领域:深度学习,网络科学,高维表征,科学学

郭瑞东 | 作者

梁金 | 审校

邓一雪 | 编辑



论文标题:

Understanding the onset of hot streaks across artistic, cultural, and scientific careers

论文地址:

https://www.nature.com/articles/s41467-021-25477-8

            

“巅峰时刻”、“黄金年龄”,对于从事创造性行业的人,例如科学家、作家、艺术家,应该并不陌生。在人生的某个阶段,灵感喷涌而出,作品质量极高。如果能发现“巅峰时刻”的形成机制,或许就能帮助提前识别出即将迎来巅峰期的新秀,有针对性地培养他们。可是,巅峰期的到来是否有规律可循呢?

   



1. 创造性活动中的探索和利用




我们可以想象有两位青年学者,一位看到身边的科学家多少年始终深耕在某一细分领域,最终迎来“巅峰时刻”,因而总结要想成功,需要在某一领域深入钻研;而另一位熟悉的大牛更换过不少研究方向,他的结论则可能是,先游牧式的广泛探索更有可能迎来属于自己的“巅峰时刻”。


哲学家以赛亚·伯林提出过一个比喻,狐狸知道很多事,能游刃有余应对变化;刺猬只知一件大事,并且专注于此。科学家弗里曼·戴森也曾用狐狸-刺猬型来划分不同类型的科学家,比如爱因斯坦是刺猬,恩里科·费米是狐狸。这些观点实际上说的是,狐狸精于对未知领域的探索(exploration),而刺猬则专注于对已知领域的开发利用(exploitation)


探索风险往往更大,却能使个人在实验和搜索中超越现有能力范围,从而增加通过意料之外、来源迥异的组合得到突破性想法的可能性。利用是一种更为保守的策略,但可以让个人在某一特定领域积累知识,持续完善自身能力,并培养在领域内的声誉。


到底是狐狸还是刺猬型的风格更容易迎来巅峰时刻?是探索还是利用与巅峰期的到来更相关?


王大顺团队的最新研究发现,在艺术家、电影导演和科学家这三种职业生涯中,个人倾向于在巅峰期开始前探索不同的风格或话题,在巅峰期开始后则明显变得更加专注。巅峰期的出现似乎并没有与探索或利用哪一个单独相关,而是来自探索和利用的合力,先创意探索,再专注利用的做法与巅峰时刻的到来密切相关。


   



2. 自动建模,对作品进行高维表征




系统性的研究需要收集海量数据,并通过算法来避免研究者自身引入的认知偏差。该研究用到了来自2128名艺术家的80万幅绘画,出自4337名导演的7.9万部电影,以及20040名科学家的发表记录,分别代表艺术、文化及科学三个不同领域。


针对不同类型的数据,分析方法有所不同:绘画采用卷积神经网络;电影是对剧本使用词向量降维,同时对演员阵容使用复杂网络建模,之后通过自编码器降维;对于科研论文则是通过共引用网络的社区发现(community detection),来得到作品在多维空间中的表征。


图1. 对艺术家、导演及科学家,获得其作品的高维表征的方法示意图。


拿到每件作品的高维表征后,就相当于有了一幅地图,可以按图索骥,找出风格相似的其它作品,并为艺术家/科学家/导演绘制职业路径,判断他究竟是狐狸还是刺猬,更关键的是,识别出在“巅峰时刻”来临前后,他的作品风格发生了哪些变化。


例如图2展示的,是抽象画家波洛克、导演彼得·杰克逊及诺贝尔化学奖得主约翰·芬恩的创作轨迹,可分为巅峰期前、处于巅峰期、巅峰期后。图中的每个点代表其作品,不同颜色代表算法对作品给出的标签。一段时间内作品越分散,说明创作者在这阶段更像“狐狸”,而聚集在一起的点则是“刺猬”的标志。

               

图2. 艺术、文化及科研领域代表性人物在巅峰期前和处于巅峰期的创作轨迹。(第一列)作品影响力随时间的变化,(右边三列)作品高维表征的可视化展示。


   



3. 创作风格如何演化?

信息熵度量多样性




在对作品进行表征之后,接下来要做的就是找出一个统计指标来量化观测结果。该场景下,我们关注的是多个作品是不是彼此风格相近,可以用其在高维表征中的信息熵来度量,信息熵越大,说明多个作品越发风格迥异。另一方面,通过随机选择作品,可以生成1000位虚拟的画家/导演/科学家的创作轨迹,以此作为对照。


图3的结果表明,相比于虚拟创作者,真实创作者作品的信息熵在巅峰期到来之前更高,处于作品风格多样化的探索状态,而在巅峰期信息熵更低,处于风格更加一致的利用阶段。从而说明个人在巅峰期前倾向于探索,巅峰期中倾向于利用这一结论。

               

图3. 依次是波洛克、彼得·杰克逊及约翰·芬恩在巅峰时刻前(图d-f)和位于巅峰时刻(图g-i)的作品集信息熵(虚线是真实创作者这一阶段的值,实线是1000位虚拟创作者的作品信息熵分布)。可见巅峰期到来之前,真实值普遍高于模拟数据,处于巅峰期时恰恰相反。


在更细时间颗粒上,创作者风格又是如何变化的呢?图4展示了创作者的作品信息熵随时间的演化。同样可以看到,在巅峰期前倾向于探索,处于巅峰期时倾向于利用。

               

图4. 依次是波洛克、彼得·杰克逊及约翰·芬恩在巅峰期前后(蓝线和红线)及模拟创作者在特定时刻前后作品信息熵随时间的动态演化。横轴表示时间,纵轴表示信息熵,由该时刻创作两件作品、该时刻前创作的最新两件作品、即将创作的两件作品组成的集合计算得出。


创作生涯中从探索转向利用和巅峰期的到来为何如此密切相关?如果只有探索或者利用,情况又会是怎样?研究中将创作风格的转变策略分为四种:一直是探索;一直是利用;之前探索,现在转为利用;之前利用,现在转为探索。图5展示了真实数据中的统计趋势,说明四种策略中,只有创作风格由探索转为利用,和巅峰期出现的概率提高相关。

         

图5. 艺术(s)、文化(t)及科学(u)领域,相比于随机模拟数据的基准概率,4种不同的创作风格改变策略对应的巅峰期到来的概率变化。


当巅峰时刻过去后,曾经的灵感不再,天才变得泯然众人。反映在数据中便是,作品的信息熵变得和随机模拟数据没有显著差异,见图6。一个不好的消息是,平均来说,巅峰时刻仅仅持续5年。

               

图6. 巅峰期结束后,艺术、文化及科学领域(a-c)作品的平均信息熵和模拟数据分布的情况,(d-f)对应的时序变化,红色对应巅峰时间,绿色对应巅峰时刻过后,灰色对应模拟数据。


   



4. 与之前研究结论契合:

小团队更多做出原创性发现




研究还分析了巅峰期到来前和处于巅峰期时,科研团队大小的变化,说明随着研究风格由原创性的探索转为对已有领域的利用,团队规模确实会变大,如图7。小团队受限于知识组成,很难对某一领域进行细致研究,在利用阶段,大团队有其优势所在。

               

图7.(a)科研团队大小在巅峰期到来前后的变化情况,其中灰色是模拟数据。(b)随着科研团队变大(横轴),巅峰期到来前后(依次是蓝色和红色)真实和模拟场景下相对数量比值的变化。可见巅峰期到来前,小于三人的团队占比高,而处于巅峰期时,处在大团队中的比例更高。


这与之前研究的结论相契合。此前吴令飞、王大顺和Evans等人合作研究发现,科研团队规模与创新有关[推荐阅读4]:小团队偏向颠覆式创新,大团队偏向渐进应用式创新。这一结论,对如今这个科研越发保守的时代有重要启发:如果想促成原创性的成果,是不是应该更多鼓励小团队进行科研呢?


   



5. 深度学习助力创造性研究




这项研究启发我们,可以通过对创造者的作品进行高维表征,判断其风格特征演化,并提供相应职业生涯建议。对于那些职业初期就像刺猬的研究者,需要提供的建议或许是,长时间反复钻研同一类作品可能扼杀创造力,在生涯初期不妨偏离大家惯常所走的路线,而不是待在安全地带。当观察到某个创作者的风格从探索转为利用时,需要对其投入更多资源,帮助他在巅峰期产出高价值的作品,这使投资收益比更高。


需要指出的是,创造性活动本质是复杂的,不存在简单规律作为成功法则。许多潜在因素都可能影响职业生涯中巅峰期的出现。此外,研究也只表明先探索再利用与巅峰期出现的相关性,要探讨这背后的因果关系,则需要进一步深入研究。


总结来说,研究使用的表征方法为创造性研究开辟了广阔的前景,也为探讨创造性作品的特征提供了一个定量框架。在未来,深度学习的进展将帮助研究人员考虑更多与创造性相关的维度,从计算的角度增强对创造性的理解。


复杂科学最新论文


集智斑图顶刊论文速递栏目上线以来,持续收录来自Nature、Science等顶刊的最新论文,追踪复杂系统、网络科学、计算社会科学等领域的前沿进展。现在正式推出订阅功能,每周通过微信服务号「集智斑图」推送论文信息。扫描下方二维码即可一键订阅:



推荐阅读



点击“阅读原文”,追踪复杂科学顶刊论文