导语


“即便在某一时刻有相似人群特征的人,选择了类似的消费方案,也不代表他们下次依然会做出相似的决策。”所以,消费者购买背后的真实驱动因素是什么?当企业有能力以量化的方式理解这一点时,就能够以更准确、智能的方式实现决策,最终达成目标增长。


7月2日,由零犀科技与集智俱乐部共同打造,旨在加速人工智能学界和产业界在因果科学领域融合探索的“因果派”论坛成功召开。零犀科技正在基于因果AI的技术理论创新商业化实践。它通过人机融合的方式,不断地深入实际业务问题,致力于解决本质问题。零犀科技首席科学家张力从AI的发展历程出发,分享了企业在实践应用方面,因果AI从理论到工程化落地过程中可有效解决的具体问题及关键价值。

丁善一 整理




1. AI发展的局限性




AI是一种可以融合人类经验的技术,具备一定容错能力和用户理解能力,甚至在样本量较小的情况下也能达成一定的预测。所以AI可以带来很多可行性的探索方向。

AI是上世纪五十年代在达特茅斯会议上被提出的,AI的不同学派,连接主义、符号主义等,分别代表了人们对世界的不同认知。比如,符号主义认知一张桌子,有桌面、桌腿的东西就叫桌子,所以定义“具备了这些符号的就叫桌子”。但是连接主义不同,连接主义认为认知需要不断地训练学习,通过大量的训练就能认识桌子。比如,幼儿看见很多在不同画面中的桌子,并不断地被告知这是桌子,久而久之,就能分辨出桌子。Web 1.0、2.0,知识库,专家系统等都是基于符号主义衍生出来的。而深度学习本质上是由连接主义演化而来的。

图1 AI的发展历程

我们还可以从另一个视角来看AI的发展:从计算智能,感知智能,到认知智能的发展。

计算智能阶段主要是上世纪,人工智能第一次陷入“寒冬”时所提出的。当时的“莫拉维克悖论”认为,人类所独有的高阶智慧能力只需要非常少的计算能力,但无意识的技能和直觉却需要极大的算力。比如,解微分方程,因为它规则明确,并且在特定领域下被执行,这对计算机来说非常简单。而如果让机器实现人的无意识感官行为,像“听说读写”的感知能力,则需要耗费大量的算力。

深度学习在感知能力上给了人类很多希望和信心,但是获得精准预测的代价是大量的能耗。而且深度学习中基于相关性的理论很难在知识获取上更高效,在认知智能上依旧效果有限。更是出现了两个典型悖论:辛普森悖论和伯克森悖论。在刘礼教授的分享中,则是用生动形象的例子对辛普森悖论进行了详细阐述。

随着AI落地产业实践,来自产业界对“认知智能”需求更为迫切,认知智能不仅仅要求对图像和世界有基本的感知,更需要对既定任务的解释和推理,进而帮助人类进行决策。这个过程需要更多的知识引入,因果理论的出现能更好的帮助我们解决这个问题,因果推断能屏蔽很多不相关的特征,比如,通过控制变量,创造其他变量之间的条件独立,进而赋予机器关注有效信息忽略无效信息的能力。




2. 什么是因果AI?





图2 因果阶梯

所以人们逐渐意识到要把因果知识融入到数据中进行算法模型的构建。因果AI并不是一个算法而是一套计算框架,能与各种模型进行衔接,比如,机器学习模型、统计学模型、心理学模型等。图灵奖获得者朱迪亚·珀尔提出了著名的因果阶梯,把数据进行了三个层次的分级:关联、干预和反事实。最底层是深度学习为代表的关联性。第二层引入了干预相关的一系列数学公式,如前门调整、后门调整、Do算子、工具变量等。最上层则是对个体进行反事实的推断,使得AI可以进行反思。他认为实现强人工智能的途径一定是因果推理代替关联推理,最终达到反事实思考。

基于以上讨论,我们总结出因果AI实践需要具备三个要素:

 建立因果图。无论主观或客观,只要提出了因果图,就可以通过数据的方式证伪。

• 相关数据。主要通过数据拟合,在没有施加干预的情况下,预测干预行动的效果。这也是因果推断和AI得以联合的原因之一。

• 反事实推断。通过对比计算结果,找出增益效果最有效的途径,并对行动的效果做出预测。




3. 因果AI如何赋能智能服务?




图3 “留量”价值挖掘

当下,互联网的潜在新增量正在慢慢耗尽。实际上,已经有不少公司开始将经营重心从“流量”获取,转移到对“留量”价值的挖掘上。在探究对“留量”价值挖掘所需要的动作时,可以用一个冰山作比喻,表面上看,企业可能做了用户分层、制定不同人群的销售策略及销售链路,制定精细化价格组合等;但实际上,表象的背后其实在探询“为什么”。这其实也是因果思维的一种体现。这种思维能帮助我们找到显性问题背后层层深入的本质原因,找到这种稳定的、不易变的本质问题,才能应对表现上千变万化,千人千面的问题。业务问题抽象为科学研究问题,这就是分布外泛化(Out-Of-Distribution, OOD)问题,面对与训练数据不同的现实世界数据,模型的性能如何才能表现得像训练时那么优秀?

目前在互联网的交互框架内,用户和消费者只被允许做“有限的表达”,比如被设计好的制式问题、按钮、案件、关键词命中等等,从而臆测主观诉求,然后希望可以用“猜你喜欢”的方式留住用户。但有限表达和臆测的主观诉求往往并不能满足每一个潜在用户的需求,留量必然存在损失和浪费。在业务中,为了达到大规模、标准化的真实“任务目标”,允许用户或消费者做开放式的表达,并能够有能力结合服务者和商品进行因果表征,对因果图进行扩充,进而规模化地去应对这种开放式的表达,并通过量化计算优化匹配,为他们找到最优的匹配策略。那这些技术又如何实现呢?

同时可以来看零犀科技业务中的一个具体业务实例,下面这一页给到了非常高维度的总结:

图3 服务的追因溯果

首先,获取用户客观特征之后,也会将企业端服务者的表征完成量化,这一点其实很重要。比如,在一段沟通过程中,为什么有些一线服务者或销售人员能够更快地理解用户和消费者想要什么、需要什么,从而与他们更有效地建立积极的正向关系。通过对服务者的表征量化,把背后的“因果图”扩充到不同的细微场景下,让更多的一线作业人员有更直观作业标准。

接着,他们可以将用户或消费者特征,与服务者表征都结合到商品的特征上,再去做最优匹配策略。比如面对不同类机器人,我们可以有效推算一个用户分类在不同类型机器人跟进情况下,计算成交概率增益差,以成交概率增益作为基础,自主地进行机器人版本的分案,给每个用户选定合适的机器人。

总结来说,零犀科技基于因果AI的核心技术理论在做商业化实践;其次,他们基于人机融合的模式实现有效的落地路径;最后,他们率先切入了销售场景,可以为合作伙伴完成直达关单的效果服务。

综合来看,因果AI在应用于智能服务领域时,可以为两个非常重要的因果问题:分布外泛化(Out-Of-Distribution, OOD)问题以及开放式表达下的用户表征问题和策略匹配问题,带去更具创造性的解决方式。在后续的分享中,刘礼教授对因果表征学习进行了栩栩如生的描绘,并对如何更好的从因果的角度理解和解决实践应用中出现的问题尝试进行回应。崔鹏教授则是围绕推荐系统中出现的分布外泛化问题进行了探索,详细描述了两条技术路径,为寻求解决相关研究问题的读者提供了一些参考以及帮助。

因果派

因果派是由集智俱乐部因果社区以及零犀科技联合发起的关于因果科学与CausalAI的前沿论坛,旨在释放因果科学在产业落地的潜能,推动产学研协同融合,实现一体化的产学研体系。



推荐阅读


点击“阅读原文”,报名读书会