AI人才都去哪里了?
点击蓝字关注
一起走进“没有围墙的研究所”
上交闵行活动现场
上海突然而至的凛冬让走在路上的生物瑟瑟发抖,此时多么希望自己是一只披着生物外壳的AI,只是装作自己很冷。言归正传,本次讲堂,是集智俱乐部与上海交通大学人工智能学生社团的第一次合作,也标志着交大AI社团正式成立并成功举办其第一次活动。“集友”们与交大的老师和学生们一起开启AI之旅,“没有围墙的研究所”在闵行点燃第一朵小火花。
在讲堂的开始,分享、创新和引领三个关键词表明了社团未来的方向和建立的宗旨。上海交通大学团委书记方曦致开幕辞。首先他希望同学们能够在这个充满未知还需探索的领域,永无止境的追求科学,相信自己的选择,追求至臻至善的科学精神。接着他建议同学们,研究的同时坚持人文关怀,使得科学真正为人类谋福祉。最后,他表达了对交大AI社团成立的良好祝愿,希望社团能成为志同道合的伙伴共同学习的平台。
上海交大团委书记方曦
一封来自2025的邀请函
未来究竟是怎样的,一些遥不可及的畅想和一些近在咫尺的变革让我们共同期待,AI是不是这样一座沟通未来的桥梁呢?集智俱乐部与交大AI俱乐部共同谱写了这封来自2025的邀请函,以四种方式一同碰触未来。
Panoramic[1]:拥抱智能时代
上海交通大学人工智能研究院常务副院长 杨小康
过去
开启一个时代不是一蹴而就的,比如人工智能这个名词从诞生到真正意义上为自己正名,这个跨度有60年之久。2016年AlphaGo战胜人类围棋冠军事件,为这个蓄谋已久的时代拉开帷幕。
里程碑事件回顾:AlphaGo为什么能赢?
第一招:利用深度卷积神经网络模仿人类高手;
深度卷积网络可以看成一个分类器,判断什么是好棋什么是坏棋,他也可以应用在人脸识别这种需要收集图像特征的技术上。
第二招:利用深度强化学习(DRL)超越人类高手;
强化学习很像是在家长看护下,孩子学习走路的过程。对于AI,他首先要与环境交互,然后训练其标注所需内容的时间与正确性。在围棋这个超大状态转移空间和需要超长时间训练标注的过程中,我们利用深度递归神经网络(DRNN)技术,结合强化学习的思想,共同服务于解读棋谱的目标。因为我们需要训练机器拥有类似灵光乍现的能力,所以使用蒙特卡洛树的搜索方式,增强随机性,使得AI不局限于已经学习过的棋谱,从而青出于蓝而胜于蓝。
最终这两招珠联璧合,通过海量的学习超越了人类高手。
总的来说,AlphaGo结合了深度学习,利用了大数据,采用了最先进的计算,从科学原理上战胜了人类棋手。
现在
战胜人类棋手并不是终点,而是一个新的起点,AI的进步给我们带来更多的惊喜。在这个里程碑式的事件之后,改良过的AlphaGoZero摆脱了对棋谱大数据的依赖,可以直接进行左右互搏,同时得益于硬件技术进一步升级,其体型和便利程度也大大提高。
这种积累几十年的科学技术的爆发,不仅仅在围棋上,在德州扑克这种复杂等级类似的策略游戏上也成功应用。
这些事实带给我们关于当下AI的两点启示:
一:AI基于算法和数据,在算力、体力、心力上击败了人类棋手和牌手。
二:AI在集合和规则固定的问题中,必将战胜人类。
以谭铁牛老师《关于人工智能发展的思考》一文为参考,未来的人工智能将在这四方面给我们带来惊喜:从智能上升为智慧,从智商转为情商,从计算演变成算计,从专才转型为通才。
通常来说,以机器学习成就AI的大脑,用超算搭建AI的躯体,以大数据作为AI的养分,那么我国在AI上是有优势的。因为机器学习领域43%的相关论文来自中国科学家;我国的太湖之光、天河二号都是世界数一数二的超级计算机;智能手机的普及又使得国人人均占有计算量高于国外;不论冷数据(人口、地理等)还是热数据(交易、诊疗等)数量都是惊人的。
未来
那么未来在哪几个方面,我们能对AI有哪些期待呢?
1)类人知觉:例如让机器看图说话或实现图像和语言之间的双向翻译,又比如让人工智能自动生成以假乱真的风景画,再自动配上诗,使得AI也有品位。
2)类脑计算:例如ibm的芯片致力于把传统计算机和做模式识别的计算机合在一起做全网计算。
3)人机协同感知:自动驾驶等。
4)群体智能:如计算社会科学用AI做大规模的数据收集整理和分析。
最后,在未来AI回对社会经济产生哪些影响,这些影响又给我带来怎样的反思?
1)就业结构改变:重复工作的低端劳动力市场在智能化流水线上渐渐消失,交易员,网络写手这些职业也渐渐收到冲击,普罗大众如何应对这些冲击?
2)伦理关系变化:机器人保姆或将改变亲子关系,美女或帅哥机器人可能影响爱情观,阿尔法狗可能遇到薛定谔猫,这些新的伦理关系和问题是否在等待我们解决?
Bottom-up[2]:AI芯片与AI算力
起点资本合伙人孔华威
站在投资者的角度,孔老师认为AI领域对于投资者是个巨大的挑战,真正如“饿了吧”这样的大项目,小投资人难以进入,而小型的项目又会出现钱花完了结果还没出来的囧境。
回到讲堂的内容,技术的发展有多惊人呢?举个例子,在12、3年前,一台当时专门采购的价值上千万的超算机,体积大到需要拆了大楼的外墙才能安置,只不过相当于现如今我们手中的智能手机的算力。在这个惊人的发展过程中,存储、计算和带宽这三者相互作用至关重要,任何一角的缺失或者不完善都会限制算力的进步。现阶段而言,存储技术是最需要发展和值得投资的。
芯片是所有计算的基础,其中光罩(mask)技术至关重要。目前中国大陆这方面技术奇缺,在已经形成三足鼎立(英特尔、三星、台积电)的纳米级处理器市场没有竞争力。
随着计算的概念在日常生活中越来越深入,我们渐渐进入这样一种生活模式:不可计算的信息就不具备统计意义,可计算的信息就可以使用并纳入相应体系。比如支付宝的芝麻信用分,又比如我们因为拥有身份证号才被认同为一个可以核实的存在。这种概念也在逐渐进入人际关系的衡量方式中,比如微信带给我们便利的线上沟通,同时又在量化这种人际尺度。我们关注我们想关注的,拉黑我们不想看或不认同,最终被局限在自己的世界中。孔老师建议,为了保证自己思维的多样性和开放性和未来的不确定性,不妨在朋友圈多留几个自己看不顺眼或者不同类型的朋友。
未来,可计算的可能才是事实。
如果要说哪个职业比码农还不如,那么孔老师认为是设计芯片的。在光罩设计制作出来以后,剩下的工作就是印刷,这是一个低廉而快速的过程,一旦开始量产,数量惊人。所以生产链决定了市场必须快速的消化这些芯片,就智能手机为例,我们希望也必须在一个小小空间中加入更多的芯片使其功能强大,同时我们又希望使用时间不要太长,以半年、一年或者两年的周期消耗掉为佳。这种产业的必然发展趋势可能会带给我们新的衡量财富的方式:计算周身携带芯片数量的多少来界定是否富有。
从中我们似乎可以理解为什么当下发展人工智能是一个国家级的战略,我们必须提高算力来适应这个新的时代。
对于未来应该投资哪个AI项目,孔老师提出了一个很有趣的想法:只投看不懂的项目,只投未来的项目,只投基于数据能计算出的事情而不是依靠人自身能解决的问题。
在分析了AI产业、计算基础和算力之后,孔老师对于如何拥抱未来的智能时代的方式是:突破自己的边界,去迎接和机器共存的时代。
Convergence [3]:
AI科研人才分布与AI在知识经济学中的应用
上海交通大学特别研究员 史冬波
一个风趣幽默的开场将我们领入AI的另一个话题,人的量度或者各种信息的量度。从《全球人AI人才研究报告》中对于人才的统计[4]来看,中国的人才储备量达到了全球第二,这是一个可喜的现象。然而令人略微担忧的是,当美国的AI人才大量集中在诸如谷歌、微软这样的大型企业中时,我国的人才却局限在高等学府或者研究机构中。而杰出人才[5]的分布来看,我国AI人才排到世界第四。就国内的分布趋势来看,北京包揽了大多数人才,其次为上海等城市。而从其他更多的数据来看,我们的人才在研究重心、核心产业等分布上和美国还有一定差距。这就引发我们需要讨论的问题:我国的产业界与学术界与知识流动是否存在障碍?
知识商业化
1)高校知识成果如何转化?
案例:上海海事大学的技术成果转化办公室自己成立公司,以技术入股形式与第三方公司合作研究,再将资金以科技奖励的方式反给实验室。学校出面为这种转化做了背书。
2)《知识成果转化法》出台的影响。
高校申请专利的数量变少了,但是质量提高了,比如申请中的摘要和权利声称的质量提高了。
对社会科学的影响
未来文科生的核心竞争力可以由这个简单的模型来描述:洞见到建模到工程化解决问题的过程。所以如果一个文科生能掌握一定的编程能力或者知道怎么做,那么他就可以用有效的方案更好的研究一个问题。
案例:研究中国的市场转型;
目标:知道中国全部合法企业的生命周期;
转变:原来关注哪些领域就对这个领域抽样,现在对总体直接研究。
从平均到差异
社会科学研究个体差异远比平均值更有意义。
案例:(学生的一个创业项目)使用AI技术将错题本作为数据来源,给出个体更好的学习建议,以提高学习效率。
方式:以高三一个班为对象,在高考前2个月的数学复习中,使用这个技术后,学生的知识点饱和程度变高了,作业量减少30%,但是月考的成绩显著提高了。
Divergence[6]: 大数据与现代机器学习
Inter高级架构师 王奕恒
Intel
很多人认为Intel只是PC时代的强者,然而这是一个误解,Intel真正的强项是数据中心。近期英特尔成功收购了Altera,使其成功打入了FPGA这个领域;收购Nervana,开始AI芯片的市场竞争。
AI与机器学习
机器学习是AI中的一部分,而深度学习又是一种特殊的机器学习方式,由于深度学习大大提高了AI对于图像的识别能力,使得它成为了现在AI研究中的热门话题。
大数据与AI
在大数据的时代,都想要快速的从这么多数据中提炼出真正有用的数据,于是AI技术开始走俏。比如通过手机或者电脑的Mac地址,可以知道用户到底预览了哪些网站或者使用了什么服务,对于这些信息的分析可以得到很多有用的信息。而真正有效的模型是需要大量的数据去训练的。
生产环节中的机器学习系统
现在生产中用到了很多机器学习,这得益于开源社区提供了丰富的组件构成了丰富的大数据生态系统。其中有几个比较重要的系统,如存储系统,数据输入系统,资源的管理和维护,编程的各种语言等等(如下图)。
大规模机器学习的趋势
A、对于计算本身要求更高;
B、对于精度要求更高,不用达到双精度,但至少是半个浮点数;
C、深度学习的各种框架能否使用同一套语言,并且各个平台兼容。
Intel BigDL
特点是:
提供了比较丰富的深度学习的知识,可以跑CN或者RN的模型;
容易和已有的大数据系统ecosystem整合起来;
性能优化程度高,支持大规模的模型训练。
两个案例
A:如京东这种电商平台上,买卖的商品都有自己展示的图片,同一个商品至少价格应该一致,如果出现仿制商品应该被剔除。因此使用了SSD的模型,检测这些图片,提取特征编码,来分析所需要的信息。十几亿的图片,只需要2天处理完。
B:欺诈检测。比如出国刷卡,银行会打电话确认是否本人使用,如果检测出是欺诈,银行要进行相应的赔偿。这其中机器需要学习的标注数据是已经存在的,过往所有被顾客投诉盗刷的事件都是他学习的对象。
与未来的对话
现场提问环节
Q1:台积电研制了7nm的芯片,中芯国际研制除了28nm的芯片,那么后者与前者的差距如何?后者在国内应用的前景如何?
A1:(孔老师)手机中80%的芯片只需要28nm的芯片就够了,但是如果尖端的应用,尤其是计算量非常大的需求中,必须发展新的制成技术,至少要10nm以下。于是这就引出三个问题:第一,初期投资很大,可能上亿;第二,人才需求很大;第三,10nm以下芯片的检测设备没有跟上。前景肯定很好,但是困难重重。
Q2: (来自外院文科生的提问)AI在语言应用上有什么方向?
A2:(史老师)科大讯飞和彩云小译可以使用序列的算法做到声音的实事反应,后者可以直接翻译。芝加哥大学社会学系开的新专业就是研究各种编程语言之间的关系。
(杨老师)语言中的字词句篇章都可以作为研究对象,比如AI已经应用于自主编写小段的新闻等,翻译也是一个重要应用领域。
(孔老师)先学Python,目前我国计算机语言上非常落后,期待有人来编写中国人自己的机器语言。同时,网络用语的更新速度很快,这些新词产生的原因很值得研究。
Q3: 从大量企业中挑选要投资的企业,这种决策是否也要引入AI?
A3:(孔老师)确实已经存在类似的工具去左右投资,不过这种投的是不确定性。投资决策的过程本身是反人性的,投顾类的软件确实比人类容易赚钱。同时很多市面上现在热的项目,在刚出来的时候都是没人理解和支持的,但是实事证明都火了。可能以后要判断投项目,在听的过程中要PK一下自己,不是结合AI和人,而是把人的部分剖掉,做纯粹的决断。
(杨老师)风险投资现在已经拒绝风险,而变为一种标准流程。但还是存在公司为了公平的投资,随机的选择,但是会使用AI来确定数据是否正确,是否存在造假。
Q4: 公司的团队中,女性分工会有不同吗?
A4: (王老师)我们自己团队中的女生活动能力很强,个人觉得女生有时会有优势,因为公司会专门需要一些女生。工作中会需要代码能力,更多的需要与人沟通,理解客户和其他方面的能力。
Q5: AI技术近期的爆发是否能看作一次科技革命?
A6: (杨老师)当下AI的成功更应该归因为爱因斯坦波尔等人搭建了科学的平台,后期互联网的应用,微电子的发展等使得原来解决不了的问题得以解决。另一方面,五个钉子:感知系统、交流系统、运动系统、认知系统、竞争与合作,经由机器学习的锤子捶打,产生了眼下看到的火花。所以AI目前的进展还远没有达到一次革命的程度。
(孔老师)哲学夹在宗教和科技中间,在现在很难学了。各个领域学到极致都能成为哲学家。
目前的学说都在把人作为中心,觉得类人的就是最好的,但是实事上应用好的发明都不是以完全类似生物才成功的,比如飞机不会煽动翅膀,轮船不会摇尾巴。所以AI没必要以人为参考对象来进步,那么哲学家是不是要考虑一下,到底机器主体还是人为主体。
Q6:虚拟货币的背后都有信用背书的背景,虽然大众并不认可比特币,但是实际流通比我们想象的广。像这种基于信用的虚拟货币,又不被大众所信任,他的应用前景在哪里?
A6:(孔老师)站在机器角度看,做比特币是合理的,所以不在意是否站在人的角度看是否合理。在未来,区分链技术一定举足轻重,所以现在参与很有必要。
(杨老师)信用问题还是信心问题。从区块链的计算过程中来看,基本上没有原理性的问题,所以比特币本身没问题,可是被坏人拿来做了坏事,所以普通人对他没有信心也是正常的。
部分现场观众合照
[1]更多内容,可以关注杨老师在微信公众号上的文章《未来人工智能:从AlphaGo到BeltaGo》。
[2]如果从科学哲学的角度听孔老师的理论,会不由自主将孔老师认定为强科学主义者,并且带有强烈的消解人类在技术开发中的主体性位置的取消主义倾向。有时候一位旗帜鲜明,言语激烈的主讲人,会给听众带来非常不同的思维冲击,因此笔者将这部分内容命名为自下而上的板块。
[3]在常识中我们有硬科学和软科学的朴素分类,就AI这个话题而言,技术层面的讲座更偏向前者,历史或者社会学维度的梳理偏向后者,所以后者其实常被称为文科中的理科或者理科生认知中的文科。史老师从公共策略这个专业讲述AI人才的情况,更像是以AI领域为核心辐射到其他相关问题上,直接将这个主题与其他学科专业联系了起来,因此我将这部分命名为发散。
[4]以web science上发表AI相关的论文数量统计为标准。
[5]以高引和科研的H指数排列前四分之一为标准。
[6]主讲人王奕恒来自英特尔的技术前线,从具体的技术和英特尔为例讲述了大数据和机器学习的应用,这是对之前已经发散出去的话题的收敛,也使得本次讲堂的中心回到了硬科学,因此我将这部分命名为收敛。
成立于2017年11月,是响应国家大力发展人工智能技术而成立的学术性质社团。依托上海交通大学人工智能研究院的大力支持,俱乐部将会打造一系列与AI相关的品牌活动,包括AI讲堂,AI竞赛,AI课程,AI畅想等,努力营造“学在交大”的AI学习氛围,促进来自各个背景的师生共同交流学习。俱乐部秉承“分享、创新、引领”的宗旨,力图提供一个优质平台,服务于交大师生以及社会人士,希望共建一个开放活跃的AI社区。
推荐阅读
Nature Communications论文解读:复杂的城市,简单的规则
集智QQ群|292641157
商务合作|zhangqian@swarma.org
投稿转载|wangting@swarma.org
◆ ◆ ◆
搜索公众号:集智俱乐部
加入“没有围墙的研究所”
让苹果砸得更猛烈些吧!
始发于微信公众号: 集智俱乐部