前言

你是不是正在努力探索深度学习的知识,却不知道如何在商业任务中应用?你是不是知道深度学习模型可以用来分析经济舆论,定位市场走向,却不知道如何真正编程实现?你是不是实验过多种国外先进的语言模型,却在处理中文语料时没有获得理想的效果。如果是这样,那么请您紧张地往下看


视线回到2014年3月31日,微博爆出马伊琍文章夫妇事件。一夜之间,“伊琍挺住”、“伊琍不哭”之类安慰马伊琍的词句在微博上激增。当日,伊利股份逆市上扬2.28%。


集智


马伊琍事件影响伊利股价,看似荒诞,其实的确是人群舆论影响市场的一个表现。我们普通人能处理的信息量有限,往往不能及时觉察到舆论对市场的影响。但是,深度学习模型可以通过快速识别篇章情感,提取实体与关系,结合市场走势信息,学习市场深度特征,来为我们提供市场交易建议。


让我们再看一个针对中文特殊性的例子:


研表究明,汉字序顺并不定一影响阅读。

事证实明了当你看完这句话之后才发字现都乱是的。


我们人类看中文就好像是一个并行的动作,一眼望去就能知意,根本没有受到乱序的影响。但是这种乱序对于普遍使用的序列模型来说就是噩梦了。或许我们就应该参考人类的视觉,先放下序列模型,改用CNN去中文?用CNN把文字当图像处理,能够充分利用并行计算能力,加快训练速度,还能达到RNN一样的的效果,我们何乐而不为呐?


针对自然语言理解(NLU)在金融领域的应用以及中文自然语言的高级处理技巧这两大主题,集智AI学园特别邀请了拥有多年中文自然语言理解商业应用经验的尹相志老师,为我们精心设计了本期系列直播课程。


集智


课程名称




中文自然语言理解(NLU)在金融领域的应用



内容简介



在本期系列课中,你将学习到中文自然语言理解(NLU)的基本原理和实用技巧,以及使用NLU技术解读投研报告等金融文本的方法。最后你还将综合所学的技术,使用模型挖掘隐藏在篇章中的情感信息,并结合市场价格行情,让人工智能协助你进行金融决策。本期系列课程,2018年1月4日正式开课。



讲师简介



尹相志

  • DeepBelief.ai 创始人兼 CEO

  • 中国首届大数据人工智能创新创业大赛发起人与题目设计者

  • 曾任华院数据(上海)首席数据科学家,数据决策(台湾)技术长

  • 获得微软2006-2017年最有价值专家称号(MVP)

  • 2002年在中国台湾创立亚洲资采,台湾第一家大数据服务公司

  • 在电信业、银行、保险、零售、广告、制造等产业提供大数据服务经历长达15年,专长为数据挖掘、信用风险控管、商务智能



课程特色



技术特色

  • 专门针对中文优化的自然语言理解技术

  • 以金融相关文本为例,全面讲授从词向量到实体抽取、知识图谱的流程 

  • 讲解中文处理的特殊技巧:字形字音字义三位一体

  • 句法处理技巧:树状 LSTM 

  • 篇章情感识别,结合股价信息,挖掘市场深度特征


额外福利

  • 全课使用最流行的 PyTorch 深度学习框架,简单、易用、轻量

  • 全网唯一针对中文自然语言的技术课程

  • 附赠1.6G、由3亿句语料训练、包含29亿个 Token 的超大中文词向量库



面向人群



目标学员

  • 自然语言处理(NLP)算法工程师

  • 对 NLU 及 NLP 感兴趣的在校高年级本科生、研究生

  • 有职业转型需求的互联网从业者

  • 需要了解前沿金融技术解决方案的金融从业者

对学员的要求

  • 具有高等数学基础

  • 了解 Python 语言

  • 了解 PyTorch 深度学习框架



学习方式



线上直播

6次在线直播课程。2018年1月4日开课,每周四晚19:30:-21:30上课


课后录播

直播结束后,课堂实录可以回放,学习时间灵活


代码实战

课程项目代码实战操作。2月下旬线上结业典礼,展示学员项目作品,评选优秀学员


作业点评和学习反馈

云平台提交作业,讲师和助教在课程微信群内答疑



2017年末早鸟价格



课程原价899

2017年12月31日前,早鸟价优惠300元

仅需599

2018年1月1日恢复原价



组队学习激励计划



优质课程,怎能独享?

现在邀请朋友一起上课,更有团购优惠大礼:

单人报名,早鸟价599元

2人组团学习,每人优惠50

3人组团学习,每人优惠60

4人组团学习,每人优惠70

5人以上组团学习,每人优惠100


组团报名,请微信联系课程小助手:


集智



课程大纲




第一课:从中文NLP码农到中文NLU世界

  1. 自然语言处理(NLP)到自然语言理解(NLU)的任务差异

  2. 语言难在哪?中文又难在哪?

  3. 深度学习如何产生语意表征

  4. RNN, LSTM, GRU用序列的角度理解语言

  • 作业项目:词神林夕养成计划


第二课:从语言序列中判断语义

  1. 序列到序列(Seq2Seq)模型观念

  2. 不只教建模,当然还要教标注

  3. 注意力(Attention)重新发明了序列到序列

  • 作业项目:掐头去尾找重点:投研报告打开的正确方式

  • 作业项目:学习做好语言标注的基本功


第三课:对语言最强大的降维攻击武器——词向量

  1. Bengio的神经概率语言模型(NPLM)

  2. Word2Vec技术介绍

  3. 制作词向量的数据清洗

  4. 还有哪些有趣的语言向量?

  5. 捡拾低垂的语意果子–类比推理、实体枚举

  6. 知识图谱抽取、同义字推断

  7. 降维可视化


第四课:用机器视觉解放长文本

  1. 谁说中文必须要分词,让机器学会「看中文」

  2. 中文的造字法则,如何能让形音义三位一体

  3. 用字向量从分词任务中解脱

  4. 文字卷积(Text CNN)进行语意识别

  5. 从卷积的角度看语言

  6. 中文的数据增强技巧

  • 作业项目:使用文字卷积评估长文本语意


第五课:别忘了这些传统NLP任务

  1. 温故而知新,被遗忘的依存句法分析

  2. 句法结构来判读歧异

  3. 从句法结构到复杂实体关系理解

  • 作业项目:人脑搞晕的股权结构关系,没关系有深度学习在


第六课:提枪上战场

  1. 情感序列识别或者是篇章情感识别

  2. 深度特征到市场预测

  3. 解决过拟合


结业项目:基于自然语言理解的交易信号预测




扫码上课



集智


扫描二维码或点击“阅读原文”,报名课程。



关注集智AI学园公众号

获取更多更有趣的AI教程吧!

搜索微信公众号:swarmAI

集智AI学园QQ群:426390994

学园网站:campus.swarma.org

集智

 商务合作|zhangqian@swarma.org     

投稿转载|wangjiannan@swarma.org


始发于微信公众号: 集智俱乐部