导语


本文是对前小米AI Lab·高级算法工程师李嫣然的专访。读博士时,她立下flag要做出一个情感陪伴机器人“大白”,给人们带来更多情感上的连接和陪伴。之后,计算机语言对话与心理学的交叉研究,贯穿于她的工作与成长的全过程。


李嫣然是集智俱乐部“后ChatGPT”读书会的发起人之一。读书会中,李嫣然博士从推理之谜、涌现之谜、幻觉之谜三个主要方面,梳理了大模型的迷思,尝试将大模型与因果推断、神经科学等更多领域关联起来,帮助我们理解现状。


以下为采访全文,欢迎阅读。

将门创投 | 来源



做事通透、想法灵性、有点大艺术家又有点小精灵的幽默风趣,这是李嫣然给人留下的感觉。但她自己好像并不这么认为,她觉得自己是实打实的“三无”AI青年,在读博士、做工作、进行情感对话相关课题以及更多人生议题上,只是因为自己都“刚好踩在了点上”。


这份幸运,究竟是必然结果,还是偶然因素?是否值得更多技术青年关注和借鉴?在嫣然的故事讲述中,也许你会得到自己的答案。


回顾成长:“三无”青年如何步步都“踩在点上”?

在所有杰出的AI青年学者当中,嫣然是个反例。


她笑称自己没有长远的规划能力,没有从小对计算机的热情,也没有从小学习计算机的基础。看着“别人家的孩子”都是兴趣至上,初中甚至小学就开始自学编程、参加比赛,嫣然这头的童年兴趣却别不在此,而在成为一名艺术家的梦想上。她从小学习书法、绘画,还是一名舞蹈特长生。时至今日,她也时常会给自己找人生Plan B:如果不做技术,我就去画画吧!


(小时候画的工笔画)


然而,天蝎座的她从小就暴露了没事就爱“卷”自己、“虐”自己的天性。虽然对计算机没有太大热情,但是要强的心理让她不允许自己学不会这些东西。


甚至,走进计算机学院、做上人工智能研究这条道路,都不是自己的规划选择。高考时,没有顺利进入自己选择的第一志愿,划档到了这个被父母建议的第四志愿信息科学技术学院。后来大一分专业的时候,又是稀里糊涂选择了人工智能专业。这两个不情不愿、不清不楚的选择,在当时,并看不到火爆的前景,但在嫣然正式进入学习之后,如有东风助力,一路蹭蹭蹭前进,成为当下社会最关注的的专业方向和未来议题。


(本科北大毕业照)


后来嫣然自己总结到:“其实我真的没有长远的规划、预见的能力。能百分百预测未来,这种能力极其极其稀缺。但哪怕没有这个能力,在合适的时候只要抓住机会,那做的应该也不会太差。”没有长远规划能力这一点,相信给了很多人宽慰。社会放大镜下,超前思考和长远目标似乎是那些敢于挑战、做出成绩的人物的通用标签。但嫣然的例子证明,这种超能力,也不一定是成为强者的必须要素。


她分享说,“现在新的技术带来了很多新的机会,并没有出现机会少到人挤人的状态。只要保持信息接收的开放心态,多跟人去交流,就不会落后太多。”


神秘的大脑:一门脑科学的基础课程开启情感对话的研究探索之旅

李嫣然又是因为什么而接受了人工智能专业的洗礼呢?她回答:源于大一下学期时的一门脑认知相关的课程。


这门课程中,每节课会讲一个脑认知相关的主题,比如说讲人是怎么识别一张人脸并记住他。人在识别的时候,脑子中会发生什么反应?激活了什么样的脑区?产生什么其他反应?这些切实发生在人大脑中、身体上的生理变化,让嫣然产生更多感同身受的连接,也让她从自己身上模拟实验。


嫣然介绍了空间和记忆的例子。比如说在宿舍复习的时候,背得贼溜,但一到教室里,什么都想不起来。但如果你复习的时候就选择在这个教室复习,考试的时候就容易想起来。包括你复习的时候一直在听一个背景音乐,这中间相当于加了一个经典条件反射(小编注:一个刺激和相应的反应之间加入一个新的刺激,当新刺激出现时也能引发条件反射。),考试的时候脑子里想到这个背景音乐,就会回想起来知识点来。


(平时读的心理学书籍)


“反过来,现在我去研究机器人、研究情感对话的时候,会常常去想,如果希望机器具有情感,那么类比人类的大脑,反推需要怎样的脑神经机制来实现?我是不是可以设计一些模块来模拟这些事情?”


尤其是随着近期以 ChatGPT 为代表的大语言模型的高速发展,嫣然也注意到,有越来越多的人们关注起了意识、记忆、语言智能、甚至生命起源等方面的话题。正是这些新技术的出现,激发了人们对于交叉学科的关注,也促进了交叉学科的研究。


从一开始,计算机或许就是嫣然的工具。她原始的出发点是揭秘神秘的大脑,计算机帮助她用代码思维去敲开脑科学以及心理认知的大门。现在,AI大语言模型的发展也为更多人带来了许多全新的、好用的、富有想象力的工具,未来必将有更多的交叉学科成果出现,尤其是那些能揭示人类奥秘、推动人类进步的成果。


《超能陆战队》的启发:我要做出一个大白!

后来进入香港理工大学读博士,李嫣然继续沿着计算机与心理认知这条路深入研究。当时的学界,对话机器人的研究刚刚兴起,大部分人都为对话机器人能带来的效率提升而感到兴奋,致力于打造7×24小时无休的客服、问答类机器人。但李嫣然却选择了搭建富有情感的陪伴型机器人。


当时的启发源自一部席卷全球的治愈系动画片《超能陆战队》。这部电影中,大白是一个医疗充气机器人,随时可以检测到人类的生命指征,提供生理以及心理上的治愈和陪伴。它呆萌又万能,软糯的怀抱给人无限的情感安慰,是主人公最好的朋友、最强大的守护伙伴。深受电影的启发,李嫣然在读博期间夸下海口:在毕业时,我要做出一个大白出来!沿着这条感性召唤的研究之路,她开启了学术探索的新阶段。


(电影《超能陆战队》)


经过了轻松快乐的博士一年级后,二年级的任务让嫣然格外痛苦。“那个时候已经确定做情感对话这件事了,但是找不到数据集,我开了很多脑洞想要找到新方法,但是碰了很多壁。比方说当时想过搜集豆瓣的短评,通过一些关键词,把相互关联的两条短评两两配对拼凑起来,仿佛是两个人在对话。类似这样的脑洞,在组会上提,大家都把我喷到不行,整个自信心就降到了谷底。为什么突然间就什么都不行了呢?”。


(博士期间和同学一起与领域大佬合影)


(读博期间给领域大佬讲解 poster)


碰壁者们向往期待的Eureka Moment,也许也不是每个人都能碰到。郁闷的一年过后,嫣然似乎也没有遇到特别的转折点。


“关于研究课题怎么就又越来越顺,开始有论文产出了这件事,我也跟博士同学们交流过,也确实有部分同学觉得没有特别的转折点,就挺过来了。如果要总结的话,我觉得这可能是一个量变到质变的过程,而且我内心也在不断调整和有取舍地妥协。最初可能会为一个 idea 感到兴奋,就不顾一切想沿着一个路线走下去;后来慢慢地,想到了 idea,会再多问自己一些问题,这个 idea 有什么缺陷吗,这个 idea 有可能再抽象一层吗……就这样,博士三年级、四年级的时候,一切都慢慢重新明朗起来!”


情绪感知:分清楚、想明白,技术的边界在哪里

毕业之后,嫣然进入小米AI Lab,负责场景化对话的研发与落地。她所在团队,致力于打造具有共情能力与知识头脑的拟人化陪伴型AI。为了打造陪伴型AI,团队通过真人多轮情感支持对话中的中文语料数据挖掘语言背后的情绪流,进而针对AI的情绪探索和反馈能力等方面进行了有效地优化。


“之前看过很多心理学的书,但是这些书都是偏科普的,告诉你什么样的理论会导致什么样的现象,并不会关注其中的数学问题,或是怎样从科学角度进行建模。这两种知识其实是互补的,但是缺少连接的桥梁,于是我就希望做这么一件事,把心理学原理通过计算机工具进行建模,用来解决机器对话中的情感交流问题。”自己的兴趣和专业在这里汇集成为一件事,一点一滴地提升了自己科研工作的幸运感。


(小米工作期间的照片)


这个阶段,希望沿着情绪对话深入研究的她,更多地与心理学从业者接触、共同工作,在实践中调整技术模型的问题。通过跟心理学专业人士沟通发现,虽然做了很多计算机和心理学的结合,但依然效果不好,有很多缺陷。


人类的心理问题会被分为不同的等级和类别。比方说,“工作多而压力大”和“因为焦虑而难以面对生活”,这是严重等级不一样的情况。“压力大”这样的问题可以与受体本人共处、逐渐被消解,不需要过多的干预,我们需要做的是如何扭转心理压力,减轻对事情的关注,Chatbot就很适合这样的场景下帮助人们。但是如果一个人已经无法面对生活,会产生身体上的不适,已经从心理延展到生理痛苦,这个时候最需要的是药物干预,而非机器人的陪伴。


再比方说,“懊悔”这个情绪类别。心理专业人士指出,这种情绪要跟其他类别区分开来。当我们识别出一个人产生指向自己的“懊悔”、讨厌自己的时候,我们不可以用其他的泛场景当中、对外界关联度更高的“难过”“愤怒”来处理。


“当时跟心理学专业人士去沟通的时候,最大的影响就是:分清楚、想明白,技术的边界在哪里?哪些的AI可以做的?哪些不适合AI来做?即使技术非常先进,但并不是万能,人类生活的复合型、人性的复杂度,无法用单一的技术视角去解锁。”没错,技术人手里的那把锤子,还真的不能到处去敲。“跟交叉学科的人一起合作项目,一定要努力锻炼自己的换位思考。不然会很容易局限在自己的学科中、自己的语言系统中,导致大家沟通时候产生很多障碍。”


那么,在情绪对话研究当中,目前还存在哪些技术解决不了的问题呢?嫣然举了两个例子。


首先,人们无法准确定义情绪。普遍认为,根据人脑的构造,情绪可以被分为六大类:快乐、悲伤、恐惧、惊讶、愤怒、嫉妒。但是,这些情绪被拆分出来的时候,还没有社交网络。所以当我们用过去的情绪分类来分析很多社交网络的文本的时候,有很多新产生的情绪类别的数据是不存在的。即使现在已经有人新划分出了60多种,甚至100多种情绪,你也很难去把人们对一件事产生的情绪进行明确的归类。


其次,每个人对于情绪的感知力,也无法做到统一。我们对同一件事情的感知,往往都会受到不同个体的经历、经验而产生不同的认识,甚至还有很多复合情绪。人们连标注都无法标注一致的情况下,怎么让机器模型去理解这件事呢?


在非技术学科沟通时,也会出现双方啼笑皆非的场面。有时技术专家希望心理学专家来帮忙来标注、界定一些情绪,但心理学专家也会产生:AI已经这么发达了,还需要我们来标注吗?似乎大家都看不上技术模型的冰冷、并不能解决很多具体问题,但操作中又认为AI是万能的。这样的学科误解存在于很多跨学科的项目沟通中,反映出大家对技术边界的定义,还非常模糊,仍然需要科研人员们不断的与外界沟通、调整、磨合。


但即使很多难题无法被解决,嫣然以及更多像她一样的语言对话从业者也会继续在这条路上继续前行。她认为,目前语言方向在吸引越来越多的人加入,这不是一场个人的战斗,而是团体的战役,大家一起在这个方向上做优化,并不会感到孤独。其次,目前基于海量数据标注去理解人们情绪方式,可能不是唯一、最优的途径。比方说GPT等大模型出来之后,会发现让它去理解人的情绪,效果也还不错。


“也许有一天会有别的技术弯道超车,出现一些颠覆式技术,使得过去的问题都不存在了。在大模型出现之前,大家比较多精力会去解决累计误差的问题,每一个小的模块出现小的问题,串联起来非常难以解决。但当我们有了端到端的大模型,这些问题就都不存在啦!”


不过,嫣然坚信技术的发展依然会带来新的研究问题和新的机会。面对网络上引起关注的“大模型颠覆甚至“消灭”了NLP的许多研究问题”的讨论,嫣然也有一些自己的想法:如果把 NLP 当成广义的理解语言和运用语言的范畴,那么 NLP 不仅没死,反而 NLPer 过去的经验依然可以在 LLM 时代发挥作用。而且,近期的一个研究也表明,即使 ChatGPT 的情绪理解能力不错,它的共情回复、情绪支持能力也还达不到顶尖水平。嫣然觉得,如果以更加开放、好奇的心态去面对技术发展,其实世界依然有很多未解之谜(科研问题)等待我们去探索。


技术之外:了不起的成长思考

“Networking这个词不像是前两年那么fancy了,但实际上,我们现在比以往更需要networking的力量。”李嫣然在聊到自己做公众号的经历时,特别强调这点。


(公众号Google三地联合活动照片)


(公众号爆款文章)


读博期间,嫣然与好朋友共同运营起公众号“程序媛日常”。那是2015年左右,正式公众号这种新型传播方式火热的时候。最开始,她们的目的非常单纯,就是当做论文笔记联手的平台,以产出倒逼自己学习输入,于是有了第一波以学校为中心慢慢扩散开来的高质量学生。正好赶上深度学习的火热浪潮,逐渐有一些技术公司联系到他们,一起推广工作或是联合举办活动,结实了不少企业专家。这个过程中又正循环吸引到更多的学生、学生又吸引到老师,老师也会让自己的学生关注“程序媛日常”这个账号。“等于说通过组织这个公众号,我认识了非常多业界和学界的前辈和同行。”


随着开源时代信息的冗杂爆炸,能公开流动的信息一定是更加低廉的信息。既然获取成本低,那就一定会劣币驱逐良币,因为会有更多的噪音。如何去获得一个更有辨别性的信息?怎么获得更有insight的东西?以及从这些信息中如何去找到发展方向?就需要大家进行高质量的Networking。


(公众号线下活动职业发展工作坊)


虽然通过公众号去积攒人脉已经过时,但是深度连接、交流的思路在当下还是非常重要的。嫣然分享networking的建议:“不要只是看,而是要参与。比方说你看到一个人写了一篇diffusion的文章很有意思,很多技术分享类的公众号其实是个人运营的,那你就可以给他留言,做具体的交流,而不是只是转发,在朋友圈里点赞。如果这个作者也很喜欢交流,你说的一句话正好打中了他,那么你们就会很自然地交流起来,慢慢深入连接。如果这个人本身周围就有一定的网络,那么很有可能他会把你加入进他的网络中(微信群等等)。那么在他个人的网络中,你就会得到二次信息交流。”


“再比如说,将门组织的闭门交流会‘料见’,其实就是进行高效优质连接的非常好的方式。”


除了Network之外,商业感知力,也是嫣然非常看重的一项能力。她认为,积累商业思考对技术同学一定是有好处的,因为技术最终是要形成商业转换的,转换成为真正的生产力。如果没有一个商业感知能力,就很难理解什么叫一个真正好的产品。


关于女性成长,嫣然也分享了自己的观点。她认为,“从脑认知的基础上来看,女性在感知情绪的大脑构造上要比男性要复杂,用到的脑区比男性要多出一个,共情能力会天然地强一些,更容易捕别到别人情绪,很容易切入到别人的立场去。那么在跟别人提出自己的技术需求,或是要介绍技术产品时,就会更有沟通上的优势。


第二,男女性成长的培养方式的区别,会形成女性对于艺术、跨界、感性的东西会更有兴趣的情况出现。举个例子,美图秀秀这个工具,男性就没有几个用到过的吧。所以这个时候你就可以提出一些特别的视角,这个在AIGC领域是非常重要的发散思维。当然,在这些问题上,也会出现男生更熟悉的领域与产品,男女是一样的。


第三,我相信双性化的趋势。在现在的社会环境下,我们不再强调‘勇敢’‘抗压’‘有力量’是男性的专有属性。女性的抗压能力其实并不比男性弱,上面这些形容也可以是针对女性的优良品质。”


(谷歌奖学金WTM)


最后,李嫣然为我们推荐了一本对自己生活影响很大的书——《我们为什么不说话》。这本书讲的是动物虽然没有人类的语言,他们是通过怎样的方式进行交流的故事。我们人类的语言太明显了,所以在语言表达的过程中,会不会忽略了很多语言之外的意义?语言会不会是一种阻碍信息高效交流的存在?比方说有些动物是通过眼神进行交流的,也有些动物是通过身体动作进行交流。那么当我们遇到一个不善言辞的人的时候,我们是否可以通过他的眼神、肢体语言来理解他的意思?如果做到了这点,我们遇到对方表达不够清晰的时候,也许就可以对他人更加包容,用更多视角去解读他的表达信息。


(《我们为什么不说话》)


讲了这么多与自己的研究相关的内容,我们也好奇,会不会有不想做技术的时刻?

“当然有啦!像是ChatGPT出来的时候,对我们来说简直就是降维打击,一般这种时候我就特别想掀桌子不干。”但是当自己做出来东西的时候,又有成就感,所以就在这两种状态之间摇摆。这种情况也非常正常。在摇摆之中,摸索前行。


“这就是自我安慰呗!我们这些搞情感对话的,工作内容不就是找到跟自己和解科学方法~”


采访在嫣然的幽默打趣当中告一段落,而她的情感对话研究工作还在继续。有繁重的技术挑战,但也会为工作找到对冲的兴趣爱好;没有长远的人生规划,但用“无为”的力量接住命运递来的橄榄枝;技术之外,不断拓展自己作为内容分享者、作为女性、作为心理学爱好者的认知边界,用Networking的方式为自己注入创新能量。


这位AI青年步步“踩在点上”的方法,你学会了吗?



嘉宾介绍


李嫣然:李嫣然本科毕业于北京大学智能科学系,博士毕业于香港理工大学。曾任小米人工智能实验室高级算法工程师及场景对话团队研发负责人,同时也兼任着北京大学心理与认知学院的行业导师

在学术方面,李嫣然多年担任 AAAI,ACL,EMNLP等国际顶级会议的审稿人,并担任 EMNLP 2022 领域主席。其曾在国际顶级会议及期刊上发表论文二十余篇,涵盖情感计算、人机对话、自然语言生成等研究领域,累计引用次数超过1800次。



“后ChatGPT”读书会


2022年11月30日,一个现象级应用程序诞生于互联网,这就是OpenAI开发的ChatGPT。从问答到写程序,从提取摘要到论文写作,ChatGPT展现出了多样化的通用智能。于是,微软、谷歌、百度、阿里、讯飞,互联网大佬们纷纷摩拳擦掌准备入场……但是,请先冷静一下…… 现在 all in 大语言模型是否真的合适?要知道,ChatGPT的背后其实就是深度学习+大数据+大模型,而这些要素早在5年前的AlphaGo时期就已经开始火热了。5年前没有抓住机遇,现在又凭什么可以搭上大语言模型这趟列车呢?

集智俱乐部特别组织“后 ChatGPT”读书会,由北师大教授、集智俱乐部创始人张江老师联合肖达、李嫣然、崔鹏、侯月源、钟翰廷、卢燚等多位老师共同发起,旨在系统性地梳理ChatGPT技术,并发现其弱点与短板。本系列读书会线上进行,2023年3月3日开始,每周五晚,欢迎报名交流。



详情请见:
“后 ChatGPT”读书会启动:从通用人工智能到意识机器


推荐阅读

1. 机器也有好奇心吗?| 李嫣然
2. GPT-4来了,但大模型的诸多未解之谜仍然未解
3. “意识机器”初探:如何让大语言模型具备自我意识?
4. 《张江·复杂科学前沿27讲》完整上线!
5. 成为集智VIP,解锁全站课程/读书会
6. 加入集智,一起复杂!



点击“阅读原文”,加入课程