导语

本文指出人工智能在慈善组织、公司、议会或城市中,都可以帮助人们获得更深刻的思考,并且解决那些由于大尺度的协调而受阻的问题。文中总结出该领域一些有前景的范例,指出其前进的方向,从人道主义救援到科学研究,并展示集体智能未来的发展前景,例如数字民主。本文强调,该领域已经超越了上一代的局限,不仅限于人机交互接口相关的工作,例如个人如何与人工智能交互,而更关注群体。在展示通过人工智能增强集体智能,特别是在处理大尺度的问题的同时,本文还会指出任何尝试将人工智能和集体智能结合起来的人都需要注意的一些设计经验。


本文原作者是英国智库 NESTA 的研究员,本文源于对 2019 年度 ACM 集体智能会议的讨论。2020 年的 ACM 集体智能会议将于 6 月 18-19 日在美国波士顿的东北大学举办,会议论文摘要截稿日期为 2 月 15 日,摘要提交地址见文末。



背景介绍


最近的几年间,存在着对人工智能的巨大的恐慌与夸大。随着人工智能持续的快速进步,关于人工智能的夸大宣传逐渐退去。对于一些问题人们有了更为现实的认识,例如无人驾驶车辆这类领域的进展速度,以及在自动驾驶算法发展成熟之前我们还要依赖人类司机多久。人类的恐惧也开始缓和,因为意识到人工智能更多地是去重塑工作岗位,而不是完全取代它们。


这样的立场,为研究人工智能和集体智能(Collective Intelligence,集体智能)的关系提供了新思路,具体来说,人们关注点放在人工智能如何能够让帮助更大的群体共同思考,而不是提供群体思考的替代品。


在最近几个月里,我们开始为这个新的领域绘制路线图——人工智能能够允许当前的集体智能呈现怎样的形态,创新的主要机会在何处存在,有哪些挑战,这些挑战又该如何应对,即 AI-enabled Collective Intelligence。在本文中,我们会为2019集体智能大会上的一个关于集体智能与人工智能的主题讨论提供背景材料,并总结从我们的研究中获得的一些初步的经验。


在大部分领域中,仅仅靠人工智能无法解决复杂的问题。但人工智能能够提供输入数据这样的工作,例如对可能的气候变化模式做出预测,因而人工智能是有用的。人工智能还可以帮助大群体更有效地思考与决策,增加人类集体智能的深度和广度。人工智能和集体智能的融合,相比于仅仅使用人工智能来进行预测和数据分析来说,获得的关注更少,而这将是本文的关注点。



人工智能如何赋能集体智能


当今的人工智能对人工和众包的依赖,比通常人们认识到的要更深远。最近的人工智能,特别是机器学习的进展,很大程度上归功于大量潜在的群体劳动。

监督学习依赖于大量带标记的数据集,无论这些数据来自如亚马逊 Mechanical Turk 或 FigureEight 这样的众包平台,还是通过 reCAPTCHA 这样的工具获得网络流量,这些数据都是人工智能成功故事的幕后英雄。反过来说,对于那些由众包完成的大量带标记的数据,很自然地成为了合适的人工智能训练数据。但这仅仅是人工智能和人群交互的多种方式之一。


众包平台-亚马逊土耳其机器人:
https://www.mturk.com/ 
众包平台-FigureEight:
https://www.figure-eight.com/ 
卡内基梅隆大学开发的人工登录验证工具reCAPTCHA:
https://www.google.com/recaptcha/intro/v3.html

图 1. 人工登录验证工具 reCAPTCHA。大众在登录互联网账号时经常会使用这个工具,一方面有效过滤了机器人账号,又通过互联网众包的力量,为大量图像识别工作进行了人工标注。


在肯尼亚和乌干达,超过一百万的农民是WeFarm平台的成员,该平台允许农民相互提出关于农业的问题,并将全世界其他农民的回答在几分钟之内汇总并提供给提问者。为了处理每日超过四万个的问题及回答,该平台使用基于机器学习的自然语言处理,以便将答案和回答匹配。


WeFarm和其他类似的例子很好地展示了人工智能如何赋能集体智能。


最简单的集体智能,可以理解为人们通过共同合作,通常是在机器的帮助下,使用更广泛的信息,观点和见解时,所产生的额外的能力。这种基于集体智能的方法,有4种扩展我们能力的路径:


  • 理解问题:生成与情境动态相关的背景事实、信息和见解
  • 寻找解决方案:寻找在其他领域的尝试过的解法或新的探索方向,或者鼓励创新者创造解决问题的新方法
  • 决策与行动:使用广泛的人员及相关专家合作产生的观点,来做出决策
  • 学习与适应:通过让参与者在更多细节上产生数据,分享知识,来提升其他人的能力,从而监控行动方案的实施。


后文关于如何设计集体智能的探讨,将会分别涉及以上四个方面的更多细节。


在基于集体智能的技术型的解决方案中,一个常见的挑战是尺度(scale),以及如何理解在一个网络中的不同的人,观点,贡献以及不同类型的数据。特别是很多解决方案依赖于来自不同来源的数据,例如将卫星、气象站、公众产生的数据,用来更好地理解环境变化。尽管这更多是软件工程上的挑战,但一旦数据被清洗并汇总好之后,它们可以为当前缺乏数据的人工智能提供丰富的输入,比如自然语言处理、计算机视觉还是语音和音频处理。


这些方法的最新进展,显著提升了集体智能的效能,具体的方法包括:提高数据处理的效率和规模、对未来事件作出更准确的预测以及识别数据集之间的新模式和关系。集体智能和人工智能的合力,能够帮助我们做出更及时的响应和决策,并且更细致入微地理解复杂动态情况和实时变化。


下表总结了我们对使用集体智能和人工智能来应对这些挑战的初步思考。




人工智能和集体智能

交互的5种形态


目前,还没有一个完整的框架,用来理解人工智能和集体智能间的交互。我们试图将现有的实践方案和学术研究对应,发现了至少存在五种理解这种相互关系的方法,如下所示。尽管这些交互种类无疑会随着该领域的发展而增加,我们仍希望它们能够成为那些有兴趣探索当前人工智能助力下的集体智能及其未来机遇的人的起始点。


报告下载:《迈向人机混合智能的下一代数字平台》

https://misq.org/misq/downloads/download/editorial/687/


形态一:机器和一群人轮流解决问题


在该交互模式下,人们有意地与不同的人和人工智能交互,轮流行动来解决问题。这是通过结合人类和机器智慧的不同能力,或通过人群和人工智能之间的反馈循环系统(允许系统的持续改进)来实现的。


一个例子是Early Warning Project,该项目通过使用众包预测和统计模型,来分析预测全球范围内的群体暴力行为。该项目结合了多种模型方法,取长补短。


Early Warning Project早期预警工程:

https://www.nesta.org.uk/feature/ai-and-collective-intelligence-case-studies/early-warning-project/


形态二:机器在人和传感器产生的数据基础上工作

 

在第二种交互模式下,人群和传感器或被动产生数据,或主动收集数据,输入到机器学习算法中。机器分析产生的洞见和经验,被平台的用户社区利用,以产生新的知识。


这样的交互,有时也会利用众包来产生带标记的数据集,用作监督学习的训练数据,或者使用非监督的人工智能方法以产生结构化的、组织好的数据。


该类的例子包括用户积极参与的大型项目,如 Zooniverse 和 MapwithAI 以及 OneSoil,该项目使得传感器被动收集的数据变得有意义。


图 2. Onesoil 平台,通过卫星地图和气象传感器捕捉农田特征,为农民提供土壤湿度温度、空气湿度温度、天气条件、病虫害等信息,辅助农民决策。


公民科学研究网站Zooniverse:
https://www.zooniverse.org/
众包开放地图网站MapwithAI:
https://mapwith.ai/
众包农业气候信息网站Onesoil:
https://onesoil.ai/en/

形态三:机器和人一起解决问题

 

在该模式下,机器和人不是轮流,而是实时地针对同一个问题的解决,做出各自的贡献。由Autodesk开发的,用于协作设计的生成式设计软件是该类的一个例子。该例子中,人工智能基于当前的参数,给设计师和其他用户提供关于不同的解的组合形式和其他设计可能性的实时的建议。如果设计师改变了参数,例如改变了房屋的宽度,人工智能会生成一系列新的设计选项。


图 3. 开放街区地图组织(OpenStreetMap)的 MapwithAI 工具。AI 工具借助深度神经网络模型,绘制出卫星图像上可能的道路,志愿者则在现场确认 AI 生成的道路并改进模型。


人机结合的建筑生产设计系统:

https://www.autodesk.com/solutions/generative-design


形态四:为群体提供更好的配对和搜索服务


人工智能还可以通过帮助人们更好地浏览大量不同类型的信息和任务,从而在实现更高效和标准化的集体智能中起到核心作用。


在这类交互中,人工智能被用作在后台提升用户在线平台上的体验。这可以用多种方式实现,例如更好的匹配有相同兴趣的用户,提升搜索功能(Syrian Archive)或优化学习过程,及公民科学家项目中的任务分配(GravitySpy on Zooniverse)。我们把这类人工智能对集体智能的贡献,看成是集体智能的润滑油。


图 4. 众包科学平台 Zooniverse 上的 Gravity Spy 项目,旨在动员网络志愿者的力量,来识别引力波观测图像中的扰动,并将其归类为信号和噪音。Gravity Spy 项目使用了卷积神经网络(CNN)来优化对志愿者分类能力的培训。


公民科学网站 zooniverse 上受欢迎的项目 Gravity Spy:

https://www.zooniverse.org/projects/zooniverse/gravity-spy


形态五:使用集体智能,开发更好的人工智能工具

 

最后,集体智能可以被用于支持开发合作型或竞争型的人工智能工具,并通过众包,来确保这些工具更加优秀和公平。


该类的例子包括试图解决在线项目 DeepFakesDetection Challenge,用于换脸工具Deep Fake带来的挑战。以及MalmoCollaborativeAi,一个专门设立的游戏,用来奖励那些更具协作性的人工智能的进展。另一个例子是通过给人工智能提供来源更加多样的训练数据,从而使产生的人工智能工具能够更好地符合公众的利益。Mozilla的 Commonvoice项目正在创建一个由众包语音贡献和验证驱动的全新数据集,以创建一个更加透明和更具代表性的音频机器学习模型。


图 5. 众包训练的语音识别项目 Common Voice,由 Mozilla 发起,你可以在线“捐出”自己的声音,作为人工智能训练的语料。


Commonvoice项目地址:

https://www.nesta.org.uk/feature/ai-and-collective-intelligence-case-studies/common-voice/

DeepFakesDetection Challenge项目地址:

https://deepfakedetectionchallenge.ai/



人工智能和集体智能

交互时遇到的设计问题

 

尽管存在很多机遇,人工智能和集体智能的结合,也会带来一些设计上的挑战。我们在此列出了一些主要的权衡,并特别关注人工智能对参与动机、群体动态和高风险环境下的责任可能产生的影响。


部署能够促进效率的算法,还是考虑志愿者们潜在的影响


很多在集体智能中使用人工智能的例子是替代之前由志愿者从事的任务,很多众包的公民科学项目,例如Zooniverse platform和 Cochrane Crowd,已指出人工智能的应用使任务变得过难,或者过于无聊,从而让志愿者失去兴趣。除了损害这些在数十年间都为这些项目贡献的志愿者的兴趣之外,还存在潜在的在社会影响上的损失,例如由于任务的自动化,损害项目对公民科学家提供的科学教育功能。


公民科学项目——人机系统的效率、参与度和偶然发现:

https://www.pnas.org/content/116/6/1902

活体系统综述:2. 人机结合

https://linkinghub.elsevier.com/retrieve/pii/S0895435617306042


权衡为了速度的设计,还是细致谨慎的部署

 

算法的优化目标通常是精度或速度。在集体智能中,上述的评价标准并不总是相关的。例如当公民被召集起来讨论有争议的或复杂的问题时,例如在数字化民主运动中,你可能会最优化算法的透明程度和包容性,而这可能让算法变慢。

 

开发精度最高的的算法,还是那些足够好的算法

 

在产业界和学术界的人工智能和软件开发中,对工具精度最优化的执迷,将会让人忽视那些和优化标准同样重要的目标。例如持续地在算法精度上的改进是驱动投资和资源调配的主要动力。但是,在集体智能的项目中,人工智能的使用可以伴随着人类智慧做出的显著贡献同时出现,例如由专家或群体提供对结果的额外验证。因此,对于集体智能项目,通常的需要是一个足够好的算法,能够解决巨大数据量化带来的问题,而不是花额外的精力在持续地为算法提升1-2%的额外准确性。

 

基于集体智能的解法总是要求将人工智能带入混乱的高风险的现实世界


一些最先进的人工智能方法目前正在封闭的实验室设置或工业背景下开发和测试,这种环境下,方法的先进性优先于可解释性,并且其数据集无法反映混乱的现实世界。


深度学习是人工智能研究前沿中最有前景的技术之一,它经常由于对可解释性的回避而受到批判。在真实世界里集体智能项目的部署中,会发现问题的规模越大,出现问题的潜在风险也越大,而这在将实验室中的方法应用到真实情况下,就会发生。这使得集体智能的项目领导者担上了沉重的责任,需要确保对使用的人工智能工具有足够的了解。我们的研究已经强调了一些案例,在这些案例中,深度学习的方法被试用然后被丢弃,转而采用了可解释的经典机器学习方法,以满足需要严格问责的公共部门的工作。上述的风险规避是可理解的,但也可能妨碍对人工智能—集体智能相互作用进行更富有想象力的探索。



当人工智能与集体智能

在交互过程中出错时,会发生什么


将人工智能集成到产品的过程中,最常见的失败源于在部署人工智能工具时,忘记充分考虑正在进行的人类互动以及群体行为。谷歌流感指数就是一个例子,该项目最初被宣传为可以成功地通过搜索来预测流感的爆发,之后发现该项目受限于模型的过拟合与搜索行为的改变。那些完全侧重于构建自动化工具的公民科学项目,可能由于没有考虑到志愿者的需求,例如关于任务的充分培训,这反而导致产出的数据质量太低,不足以用于人工智能的训练。即使是出发点良好的项目,例如有谷歌Jiasaw和维基百科开发的Detox工具,通过结合众包和机器学习,用于识别不友好评论,也只在坏人没有找到如何欺骗算法的短期内有效。这样的脆弱性,是面对不断变换的环境下,无法及时高频率更新的自动化工具面临的共同挑战。



图 6. 谷歌流感指数,2008 年由谷歌发起,旨在通过网络关键词搜索大数据,来推测各地区的流感趋势。但因为多次预测失准,在 2015 年被下线。

最后,目前的人工智能算法严重依赖大量干净的便于机器阅读的数据。即使在公共领域存在这样的数据,如果有许多利益相关方参与数据共享的谈判,人工智能的部署也会遭到长时间的拖延。例如纽约市消防局,由于组织文化的影响,在使用人工智能增强版火灾风险预测模型(Firecast3.0)时遇到诸多困难。

现在,更多人也开始对集体智能领域感兴趣,伴随着学术界不断增长的对探索有趣的富有想象力的人机交互方式的兴趣。例如 GovLab’s 最近关于如何更好地结合人工智能和集体智能来识别公民需求的研究,以及MIT集体智能中心的关于在Zooniverse这个公民科学平台上使用机器学习带来的影响的研究。但这相比数亿花在人工智能上的研究,这类的研究还太少。



纽约大学 Gov 实验室的报告《通过结合人工智能和集体智能来识别民众需求》:

http://thegovlab.org/new-report-identifying-citizens-needs-by-combining-artificial-intelligence-ai-and-collective-intelligence-ci/

2020 年 ACM 集体智能大会官网: 

https://ci2020.weebly.com/

更多人工智能与集体智能的基础研究:
https://www.nesta.org.uk/feature/ai-and-collective-intelligence-case-studies/


译者:郭瑞东
审校:王佳纯
编辑:赵千里
原文地址:
https://www.nesta.org.uk/blog/aici-future-minds-and-machines/



推荐阅读


Science经典论文:如何检测复杂生态系统中的因果关系?
2020年复杂性科学必读经典:入门+进阶书单20本
超越简单规则——用图神经网络对复杂系统进行自动建模
加入集智,一起复杂!





集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

◆ ◆ 

搜索公众号:集智俱乐部


加入“没有围墙的研究所”

让苹果砸得更猛烈些吧!

本篇文章来源于微信公众号:集智俱乐部