机器之心报道

演讲者:徐飞玉

参与:微胖、黄小天




面向开发者的世界上最大的人工智能主题在线演讲与对话大会 AI WITH THE BEST(AIWTB)于 2017 年 4 月 29-30 日在 AIWTB 官网上通过在线直播的方式举办。昨日,机器之心报道了 Ian Goodfellow 线上分享的有关对抗样本与安全隐私的精彩内容。


在本文中,机器之心对这次大会上 AI 专家徐飞玉的演讲进行了梳理,并附有大会演讲视频和 PPT。今年 3 月 23 日,联想宣布成立人工智能实验室,同时宣布徐飞玉博士加盟联想,作为副总裁负责联想研究院人工智能实验室的研发工作。


集智


据悉,1998 年以来,徐飞玉博士一直在德国人工智能研究中心工作。加入联想之前,她是该研究中心语言技术实验室文本分析研究组负责人以及首席研究员。


徐飞玉博士在多语言信息系统、信息抽取、文本挖掘、大数据分析、商务智能、问答系统以及 NLP 技术移动应用等领域拥有丰富的经验,领导过 30 多个国内外研发项目,研发以及管理经验涵盖了创新的完整周期,包括基础研究、应用与研发以及产品商业化。

2016 年 11 月,前微软亚洲研究院常务副院长芮勇博士加入联想,成为联想新的 CTO;数月间,联想新的技术战略——「智能驱动的设备+云」战略——已然成形。人工智能正在成为联想着力加强和投入的战略领域。


演讲主题


人工智能的变迁:从实验室走入日常生活(The Migration of AI from Laboratories into Everyday Life)


今天,人工智能已不仅仅存在于科幻小说之中。大数据及其分析平台、先进的机器学习方法、高速互联网、全球性开源研发社区等大量涌现,这一切催生出了强大的人工智能应用,比如网页智能搜索、机器翻译、智能交互式助手和商业智能软件。


在本次演讲中,我将会概述德国人工智能研究中心的跨学科应用型研究,以表明人工智能未来应用的广大前景。我也会介绍人工智能从实验室走进日常生活的变迁,及其已被证明有效的商业化。正是这种商业化的驱动方法缩短了人工智能从研发走向产品的周期。本次演讲将会介绍一些核心方法,包括设计思维的整合,结合研究与产品使用的整个研发过程的最初步骤等。接着我会着重介绍语言技术的两个应用领域并解释其具体应用:1) 文本大数据分析,2) 智能会话智能体。


集智


徐飞玉博士首先介绍了什么是人工智能:能让机器向人类一样行动。


人工智能热的原因,很有用。提升人类感知和认知,比如搜索引擎。另外,人工智能还可以帮助人与机器交互。





为什么现在会出现人工智能热呢?原因有以下几个方面。比如数据、技术、硬件等等。





人工智能之所以很热,还因为在某些方面甚至可以超过人类(超人智能,比如 AlphaGo)。那么,对比之下,人工智能与人类智能有哪些相似与不同呢?




因此,人工智能可以做一些人类无法做到的事情。




人工智能的发展让很多新的产品、服务和商业模式成为可能,也大大提升了现有产品、服务和商业模式。以下是一些重要技术领域。


集智


人工智能已经被许多领域应用。如下表所示,金融服务、制造业、农业、教育等,一共 216 个领域。


集智


接下来,就看几个利用最新技术的例子。比如,对话用户界面和对话系统。




接着,徐飞玉博士讲了当前的会话式助手的三个参数:1. 能动性(用户、系统、两者混合);2. 中值/方式(声音、文本、图片、触控);3. 会话深度(搜寻、问题回答、命令导向、真实会话)。




当你对语音助手说,给我看看 Peter 在北京的照片时,它首先会分析人物是 Peter,位置为北京;接着它会在图片库中进行检索,并最终给出 Peter 在北京的最后照片。




所以,语音助手图片检索的整个过程可以描述为:输入、分析、理解、行动选择、整合、输出。




接下来,徐飞玉博士重点介绍了文本大数据分析处理这一具体应用。



首先,她先解释了大数据,认为其有如下三个特点:大容量(数据大小)、高速度(变化的速度)、多种类(数据资源)。




在大数据中,文本是最大的也是最常见的大数据来源之一。



但文本数据却是非结构化的。




非结构化也就意味着需要对其进行分析处理。所以接下里要讲的什么是文本信息分析处理。


文本信息分析处理是指在给定一个非结构化文本的情况下,文本分析系统能够自动识别并提取相关实体或概念之间的关系,这种关系对于满足用户需求很重要。


随后,徐飞玉博士讲了文本分析处理技术的 3 个通常性应用任务:




通常性应用任务 1:用于信息查找者的信息访问。


在搜索引擎中,文本分析处理技术可以将用户非结构化的文本性提问映射到更结构化的标准提问,从而帮助信息查找者完成信息访问。



通常性应用任务 2:用于信息提供者的信息获取。


在网络中,信息提供者可从海量免费文本中提取结构化信息,从而可构建知识库以达到信息储备的目的。




接着,演讲中给出一个有关流行歌星的实例:如何从网络中获取流行歌星的完整社交网,并将其分为 4 类:流行歌星、艺术家、个人、团体。



通常性应用任务 3:大数据分析


大数据分析可在结构化数据和非结构化数据之间建立连接:


  • 大规模信息监控

  • 分析:领域、市场、趋势等分析

  • 观察:浏览相关最新进展




演讲给出了文本分析处理技术的架构流程图。




最后,这次演讲对人工智能的贡献作了以下总结:


  • 感知:为视觉、听觉和感觉解释传感器输入

  • 观察我们的世界:监控数据和网页

  • 知识:使全世界的知识触手可得

  • 理解:实时分析海量数据

  • 从经验中学习:机器学习

  • 智能化:机器人、自动化流程  集智



点击阅读原文,报名参与机器之心 GMIS 2017 ↓↓↓

集智


点击原文链接,与徐飞玉博士相约5月20日,畅谈一整天

始发于微信公众号: 集智俱乐部