揪着自己的头发离开地球——AI视野(一) | 张江
张江 北京师范大学副教授,集智俱乐部、AI学园创始人,腾讯研究院、阿里研究院、网络智库专家、人工智能研究者与布道师。
导语
我决定写下“AI视野”这一系列的文字,逼迫着自己在繁冗的琐事之中剥离出来,让思想腾飞,畅想人工智能的未来。本篇文章相当于一个开场白,我会把这个系列文章要说的几件事儿简单的罗列一下。详细的论述会在今后的文章中一篇篇地展开讲。我唯一希望的是,在我拔光所有的头发之前,能给诸位看官带来一点新的东西。
前言
我的博士时光是安静而快乐的。那个时候不用上课,也不用应酬那么多的社会关系;更关键的是,我的导师完全不干涉我的博士论文研究。这让我拥有了大把大把的时间可以如此贪婪地阅读和思考。就在这段时间之中,我陶醉于《黑客帝国》的天马行空,阅读了《GEB》这本奇书,搞懂了图灵机停机原理以及哥德尔定理的证明,完成了让我激动不已的摄像机-电视自指实验,创办了集智俱乐部网站。那时候,我会因为顿悟到虚拟世界需要人类注意力能量的驱动而兴奋不已;那个时候,我会在同学聚会的时候和他们信誓旦旦地说,五年之内一半以上的人类将会进入虚拟世界;那个时候,我会因为“看到了”神人的觉醒和“数字化成佛”而忧心忡忡……。总之,那个时候的我仿佛已经“揪着自己的头发离开了地球”。
十多年过去了,我还在地球。然而,人工智能时代真的已经来了。尽管在细节上,现在社会并非我当年所想象,但是,大体趋势却真的已经沿着我的思考之路而发展,甚至在有些方面会更快。站在AI时代的风口浪尖,很多人都在削尖了脑袋让自己的创意和AI扯上哪怕有一丢丢的联系。然而,我却认为正是在这种时刻,我们才更应该仰望星空,再次揪着自己的头发脱离地球吸引力。我相信这一次的脑洞与腾飞会与十多年前的那次有着本质的不同,因为AI时代已经来了,我们所有的想象都可以构筑在更高的基础上了。
链接是互联网时代的主题词儿,那么AI时代来了,似乎我们应该把“链接”扔进垃圾桶了,或者至少应该创造出一点新词儿才算对得起AI时代不是?
然而,我想说的是,现如今大火的深度学习其实仍然是一种链接的利器,只不过这种链接与互联网时代的链接已经相差甚远了,因为它是一种很重的链接。啥意思呢?就是说如果我们用深度学习的方法去链接两种东西A和B,那么A和B之间的信息量传递就会非常的大,甚至于非常地深。如果说传统互联网所创造的链接不过是A和B的单点沟通,那么深度学习所创造的链接就是多点沟通,甚至多模态沟通。深度学习可以让隐含在信息流之中的“意义”得以通畅地流通起来。
为什么那么说呢?这是因为深度学习的本质实际上就是在解决一个“端到端”(End2end)的问题。大家回想一下你能数的出来的深度学习所创造的那种牛B的应用,究其本质其实就是在把一端的信息传递到另一端。通俗地说,深度学习就是一种广义的翻译机器,它能够把图像翻译成标签,可以将嘴唇的动画翻译成文字,可以将一篇完整的文字翻译成一个简单的摘要文件。所以,其实看多了深度学习你就不会觉得它还那么神奇,它本质上讲并没有比从A端到B端的比特传输更厉害。
集智俱乐部在2010和2012年举办深度学习读书会的时候,周边的人还基本没有听说过深度学习这个东西。然而,似乎就是在2017这一年,深度学习突然一下子就变得老少皆知了。各大人工智能公众号开始大批量地转载、翻译国外有关深度学习的文章;BAT们重新展开了他们的产业布局,纷纷推出了自己的AI战略,追逐Google,Facebook等的前沿研究;政府也不遗余力地推动着人工智能的发展,把人工智能首次列为了两会的议题。
然而值得注意的是这种跟风很有可能一起势就已经落后了。要知道,深度学习这种东西早在2006年的时候就已经在美国学术圈大火起来了;在商业圈的火爆也是在2011年就已经开始(Google的X实验室用自编码器网络从海量YouTube视频中学出了猫脸)。所以,基本上来说,我们的AI布局已经比美国滞后了大概5年。人类在感知复杂的外在世界的时候,总是忘记了“延迟性”。新事物在人际之间的传播是有滞后的,更何况,越新的东西就越是不容易被更多的人理解、看到,所以它的滞后性也就越大。
我所说的深度学习之后是指深度学习这种技术已经渗透到了各行各业,以及人类社会的每一个角落。那么深度学习之后是什么?我猜会是多主体智能(Multi-agent intelligence)的复兴。我们集智俱乐部曾经推过一篇Science翻译文章,叫做“经济推理与人工智能”。只可惜,这篇文章过于没有引起多少人的关注。但其实它却暗示了一种趋势,就是当人工智能已经遍布到我们社会生活中的每一个角落的时候,人工智能彼此之间的交互就变得极其重要。于是,每个人工智能主体就会按照人类给它规定的方式自动化地完成任务。到了这个时候,主流经济学就有可能在这些机器算法身上复兴。
虽然前几年物联网就曾经是风口,但是由于人工智能技术没有跟上,导致了这股风潮的夭折。而当深度学习芯片像大白菜一样便宜的时候,每个智能硬件之中都装入一个智能芯片就不再是问题,于是物联网就会再次火爆。而那个时候,随着联网的设备变得越来越多,每个设备又是一个小的智能体,于是多个智能体之间的协调就会变得非常重要。
现如今GAN的大火就已经说明多个主体的智能会比单个主体厉害得多——因为GAN已然形成了一种全新的深度学习范式,它把单体学习的问题升级为两体共同学习的问题,这反而让性能得以大大地提升。所以,深度学习之后将会是多主体智能、群集智能的天下。
机器能够有自我意识吗?这个问题取决于我们如何定义什么叫自我意识。我们不妨把自我意识定义为一种自我觉知的能力,就是我知道我自己正在做什么、想什么,并且我知道我知道这件事。
如果我们同意上述的描述性定义,那么,其实早在计算机产生之前,哥德尔、图灵、Kleene等人就已经发明了定义自我意识的数学语言。在计算理论中,有一个叫做Kleene递归定理的东西,这个定理保证了我们可以用计算机产生一个“自我”。于是,我们只要让一个程序能够模拟它自己的动作,那么这个程序就也可以产生“自我意识”。它存在着两个层次,一个是行动中的我,一个是思考中的我。这个思考的我还可以模拟行动中的我。
虽然数学上早已证明了其存在性,却很难在实践中构造出这样的自我模拟程序。更重要的是,我们不能仅仅构造出这样的裸意识机器,还必须给这个机器配上一定的“智能”,甚至和外界沟通的语言,才能让我们看到这种意识机器。所以,我们必须依靠人工神经网络的方法来将这样的自我意识机器演化出来。
很早以前,LSTM之父Jürgen Schmidhuber就提出了一个叫做“哥德尔机”(Godel Machine)的东西,他利用一套数学语言构造了一个能够自我修改源代码,不断学习的机器。后来,Schmidhuber老爷子开始关注强化学习,估计是希望能够通过学习的方式让LSTM能够自动学出来一个哥德尔机,那么这个家伙就很有可能具备了自我意识。然而,要做到这一点也许比我们想象的要难得多。
下面,再让我们来说说人。已经有很多研究指出,人工智能的强势崛起必然会替代大量的人类工作。而按照工作技能难度的划分,中等技能水平的工作更容易被机器替换。人类被机器所迫,将转移到技能轴的两端,并且会迅速地形成两极分化。
一极的人被迫进入了全民娱乐、全民游戏的时代,它们唯一的生存方式就是支付自己的注意力去玩各种各样的游戏。于是整个经济形态将会发生彻底的改变,有一批人将会演变成职业的玩家,他们唯一的工作就是玩游戏。他们的注意力支出就是让他们维生的重要手段。在未来人们要解决的一个重要问题就是如何度量注意力。有了注意力度量才可能形成注意力支付体系。
注意力的另外一种体现就是意愿,它可以看作是注意力在一个人愿望上的集中。现在的问答社区实际上就可以被看作是这种意愿经济的雏形,因为问问题实际上就是在发出一种诉求。如何生成愿望,甚至于高质量的愿望将会是驱动着人工智能演化的重要形式。所以,未来高质量的愿望将会成为一种稀缺。
最近上映的电影《攻壳机动队》(Ghost in the shell)就很好地描述了大范围脑机接口应用的场景。这个时候,人将会面对各种混合现实,人与人之间的沟通也可以直接通过心智来完成。
《攻壳机动队》剧照,虚拟与现实的混合
进一步,由于每个人都可以通过意念操控链接在互联网上的机器,所以每个人都可以像神一样地存在,那么各种古老的神话传说都可能成为科技类产品设计的创意理念源泉。未来的一次科技大突破将有可能在生物学、脑机接口和量子计算的交界处爆发。
奇点这个概念最早起源物理学,它是指引力作用而引发的一种时空高度扭曲的点。在这个点的附近,时间被拉得无限缓慢,空间变得无穷小。
技术奇点被定义为当机器的运算能力超越人类的运算能力那一天。然而,我认为技术奇点将不仅仅是机器运算能力超越人类,而是会发生更多类似于引力奇点的效应。例如奇点的空间效应和时间效应。
总之,人类走向奇点将不会是全球同步进行,而是会存在着一个空间上的滞后。很可能地球的某个大城市将率先进入奇点,而由于时间扭曲的效应,外围的城市将永远无法追赶上这种趋势。我们将对技术奇点的各个方面展开详细地讨论。
希望这一系列文章能够引发你更多的思考。
继续烧脑
集智QQ群|292641157
商务合作|zhangqian@swarma.org
投稿转载|wangting@swarma.org
◆ ◆ ◆
搜索公众号:集智俱乐部
加入“没有围墙的研究所”
让苹果砸得更猛烈些吧!
始发于微信公众号: 集智俱乐部