“集智-凯风研读营” 项目是由凯风基金会资助、集智俱乐部发起的,针对量子信息、人工智能、复杂系统、计算社会科学等特定主题的封闭式交流活动。
我们的目标是:汇聚术业有专攻但又视野广阔的青年学者,进行跨学科交流,寻找不同复杂现象背后的统一规律。
我们的愿景是:通过深度研读讨论前沿科学研究,共同界定和审视新的问题,实现跨文化、跨学科、跨领域的学术创新,形成真正具有原创能力的学术小生境。
集智-凯风研读营始于2016年,每年一次,集智科学家们围绕“网络、几何与机器学习”深入地讨论了几何(尤其是双曲几何)在机器学习、复杂网络和张量网络等领域中应用的一些最新进展,激发出了很多科研成果,包括出版的科普书籍和在顶刊上发表学术文章。
同时,在集智-凯风研读营学术委员会的提议下,为了更好的资助年轻的科研工作者,支持他们的科研想法和创意,成立了“集智-凯风奖学金”计划,用于资助参与研读营的国内外学生的科研工作。
目前,在大家踊跃的申请下,由学术委员会投票审核,已经确定了2020年的资助项目,如下:
通过对大家的支持,已经有很多同学初具成果,在顶刊和顶会上发表了相关的文章,也很好的促进对开源社区的贡献,基于此,我们今年希望可以资助更多的原创性有价值的科研项目,促进科研的发现和推进。
目标:支持在从事原创性的科研成果和发现的年轻科学家,促进集智-凯风研读营的科研产出。
方向:与集智俱乐部参与推动的前沿科学方向相关,包括但不限于复杂系统方法与理论,机器学习与人工智能,统计物理与量子计算等等。
资助名额:大陆和国外个各三个名额,每个人资助10,000人民币(大陆)或者2,500美元(北美)(见注释1)。
原则上 a) 30岁及以下,b) 在读学生,c)通过个人申请及初筛入选集智凯风研读营的成员(见注释2)。
1. 新一届资助计划的预申请截止日期:2022年1月15日。如果你有意向申请,也可以先填写预报名表单与负责人咨询沟通:
2. 申请人准备两页申请计划书(不包括参考文献)。
第一页介绍本人正在进行的研究计划,需要指出预期发表的期刊或者会议;
第二页介绍本人的开源科学志愿者服务计划,需要与研读营结合,例如总结往期研读营的线上内容并按照主办方的要求撰写科普笔记一份,贡献公开讲座一次;
3.集智-凯风研读营组委会受理预申请并组织审查,请发送至wangting@swarma.org。审查结果将以电子邮件形式反馈至申请人。
所有申请经学术委员会打分选择前6名(目前还剩3个名额)进行资助。
-
-
在项目成果以会议或期刊论文方式公开发表后,拨放奖学金的剩余部分。
-
如果项目成果未发表或发表会议/期刊影响力远低于申请书中的预期目标,则由剩余部分由集智-凯风研读营组委会成员讨论决定是否继续发放。
当项目资助完成,相关成果需要致谢集智俱乐部和集智-凯风研读营。
本项目负责人是集智俱乐部秘书长王婷,如有疑问和未尽事项,可以咨询18621066378。
注释1. 由The Big Mac Index(麦当劳巨无霸购买力)决定即 20 元=1个巨无霸= 5美元 https://www.economist.com/news/2020/07/15/the-big-mac-index 。因此资助金额约为500个巨无霸。
注释2. 研读营介绍及2020招募:集智最高Level的学术会议 | 集智凯风研读营公开招募
多视图时空图神经网络研究及其在睡眠分期的应用
贾子钰,北京交通大学在读博士,在新加坡国立大学访问交流
睡眠是一种人类重要的生理活动,随着生活节凑的加快、竞争压力的增大, 以及不良生活习惯的存在,越来越多的人被睡眠问题所困扰。利用脑电信号进行 睡眠分期的研究对睡眠质量的评估和睡眠疾病的预防、诊断、治疗有着重要的意义。但是,现有方法忽略了脑电数据的时空特性,特别是大脑的空间拓扑结构的挖掘和利用。
因此,本课题拟通过多视图时空图神经网络进行睡眠分期,其中多视图指的是大脑的空间关系可以由两种不同的脑网络视图反应,即功能连接性视图和空间邻近性视图。具体地说,现有神经科学的研究表明大脑中不同脑区共同完成一项任务时存在互相协作的现象,因此不同脑区间会产生相关或者依赖关系, 这种关系可以被表示为大脑区域间的功能性连接。此外,邻近的大脑区域也会互相影响,距离越近影响可能越大,这种影响关系可以被表示为基于物理邻近性的大脑空间距离连接。除了大脑的空间特性以外,大脑在不同时间上的变化模式也会随着人体生理情况的改变而改变。
为了充分捕获大脑的时空特征,我们提出了一种新颖的多视图时空图神经网络进行大脑状态的判别和睡眠状态的评估,进而服务于睡眠疾病的诊断和治疗。
有环因果模型的基础、学习和推断
回顾人类从亚里士 多德开始的 2000 多年的因果研究历程,包括哲学,科学,统计,法律等在内的各个学科都有相关探索。目前主流的两个因果科学研究框架,是Judea Pearl提出的结构因果模型 (Structural Causal Model, SCM)[1, 3, 4, 5],以及Donald Rubin的潜在结构框架 (Potential Outcome)。
目前绝大多数研究者用该框架进行因果建模和使用图方法进行因果推断的时候,通常假定因果图是无环的。然而,现实世界中的许多系统是存在反馈的,例如经济学中供给和需求,这样的系统需要用有环 SCM 来建模。但是因为放弃了无环假定,无环SCM 拥有的诸多良好性质不再成立,导致了许多困难,例如模型无解或者无唯一的 Seeing, Doing, Imagining 分布等。在此情况下,如何学习有环 SCM 并且进行因果推断成 为近年来许多研究者关心的一个重要课题,详情请参见文章[2]。
我们选择从哲学中的信息因果和深度概率编程出发。我们改变现有的数据联系因果机制的方式。希望这一研究能够缓解有环 SCM 的相关难题,为使用 SCM 进行统计因果建模提供一些通用的理论基础和学习算法。
[1] Bareinboim, E., Correa, J. D., Ibeling, D., & Icard, T. (2020). On pearl’s hierarchy and the foundations of causal inference. ACM Special Volume in Honor of Judea Pearl (provisional title).
[2] Bongers, S., Forré, P., Peters, J., Schölkopf, B., & Mooij, J. M. (2016). Foundations of structural causal models with cycles and latent variables.
[3] Pearl J. The seven tools of causal inference, with reflections on machine learning[J]. Communications of the ACM, 2019, 62(3): 54-60.
[4] Pearl, J. (2009). Causality. Cambridge university press.
[5] Schölkopf, B. (2019). Causality for machine learning. arXiv preprint arXiv:1911.10500.
奇怪和创新
徐绘敏,得克萨斯奥斯汀分校博士在读
创新是什么?苹果的创始人 Steve Jobs曾经说过,Creativity is just connecting the dots where others haven’t。创新的想法来自于点的连接,而在别人眼里这些点之间没有关联,甚至不合常理。可是纵观行业内取得颠覆性创新的公司,他们的想法在当时不都是荒诞不经吗?几十年前谁能想象我们有一天可以住进陌生人的家里,可以搭陌生人的车,可以足不出户网上购物呢?而 Airbnb,Uber 和 Amazon 这些奇怪的想法确是企业创新的最初动力和核心竞争力。
奇怪的想法源于人的提出,招聘就是企业保持源源不断创造力的一种重要途径 (Herstad et al, 2015)。传统上,人力资本 是根据职位,经验、教育和培训水平来测量的 (Hartog, 1986)。基于技能网络的方法可以给我们提供一种新的视角来研究人力资本。大量的研究表明技能多样化的重要性 (eg., Anderson, 2017)。决定技能多样性和创新之间的关系要求我们不仅要关注员工的单个技能,还有技能的组合。之前的研究发现不常见的技能/知识组合可以获得更高的工资 (Anderson, 2017) 和赢得更高的科学影响力 (Uzzi et al., 2013) 。通过企业的招聘数据,我们可以识别出企业对于有奇怪技能组合人的需求。同时,将企业的奇怪程度和企业的专利创新相关联,我们可以验证奇怪是否可以带来创新?
目标:阶段一的目标是数据集的匹配工作,包括公司的招聘数据,专利数据以及基本财务信息,一共有3k家匹配的美国上市公司。阶段二的目标是探索公司在招聘人次策略上的与众不同是否可以导致专利的颠覆性创新,发现是正向相关。阶段三是证明结果的稳定性,需要控制公司的总资产,总人数,以及在R&D上的投入资金,行业和时间信息。目前阶段三还在探索中。
[1] Anderson, K. A. (2017). Skill networks and measures of complex human capital. Proceedings of the National Academy of Sciences, 114(48), 12720-12724.
[2] Hartog, J. (1986). Earnings functions: beyond human capital. Applied Economics, 18(12), 1291-1309.
[3] Herstad, S. J., Sandven, T., & Ebersberger, B. 2015. Recruitment, knowledge integration and modes of innovation. Research Policy, 44(1):138–153.
[4] Uzzi, B., Mukherjee, S., Stringer, M., & Jones, B. (2013). Atypical combinations and scientific impact. Science, 342(6157), 468-472.
我们关心如何如何根据技能的组合计算weirdness,并且将奇怪程度累加到职业和公司中。
以及创新跟 weirdness之间是什么关系?企业文化是如何影响奇怪和创新之间的关系。
结构和动力学信息共同启发的网络推断方法
复杂网络广泛的存在于社会、气候、技术、生物等系统中[1]。在这些复杂网络中,节点之间 通过连边进行相互作用,并改变自身状态,从而产生时间序列数据。然而由于测量手段有限, 存在测量误差和隐私保护等原因,我们往往并不能够观测到完整的网络结构和全部节点的时间序列信息。本项目关注的问题便是如何通过观测到的部分节点连接信息和时间序列信息去推断 未知部分网络结构。
链路预测作为网络科学中的经典任务,试图补全网络中的缺失连边,然而大多数连边预测任务都需要完整的节点属性信息。在现实中,由于未知节点很难被观测,所以这些属性信息往往难以得到[2],因此,传统的链路预测方法将不适用于这一任务。图网络模型在近年来将深度学习技术应用到了网络数据中,其中一些方法被提出用于解决未知连边的推断问题。但目前尚未有一种方法可以同时使用已知的连边模式和节点时间序列信息来解决这一问题。
本项目将第一次同时利用这两种信息来完成未知部分的网络结构推断问题。将采取交替训练的方案,获得比集成两种学习方法的推断结果更高的准确率。并且通过加入结构信息的帮助,我们将显著降低对时间序列数据量的需求。
[1] Albert R, Barabási A L. Statistical mechanics of complex networks[J]. Reviews of modern physics, 2002, 74(1): 47.
[2] Kossinets G. Effects of missing data in social networks[J]. Social networks, 2006, 28(3): 247-268.
[3] Kim M, Leskovec J. T he net work complet ion problem: Inf erring missing nodes and edges in networks[C]//Proceedings of the 2011 SIAM International Conference on Data Mining. Society for Industrial and Applied Mathematics, 2011: 47-58.
[4] Xue Y, Bogdan P. Reconst ruct ing missing complex net works against adversarial interventions[J]. Nature communications, 2019, 10(1): 1-12.
逆转创新的时钟
崔浩川,北京师范大学博士在读,在芝加哥大学访问交流
随着人类社会预期寿命的增加,我们面临着巨大的老龄化挑战。这种老龄化的挑战深深影响着国际政治、经济、科技格局 (Azoulay 2020)。与人类社会老龄化相对应的,是科学与技术领域也日趋面临着老龄化。然而,通过对WOS期刊数据库的调查,老年科学家正在以肉眼可⻅的速度扩大在科学期刊发表 的产出和影响力(Jones and Weinberg 2011)。同时,Packalen and Bhattachrya 2019 发现,年龄阻碍着科学家接受并尝试新的科学话题。老化让科学家倾向于保留了更多的保守思想,减缓了研究领域的发展,在一定程度上抹杀新兴思想的产生。我们研究科学家相对于周围的同事和想法是如何衰老的,并探讨衰老对科学进步的影响。通过对Web of Science 数据集中2000万篇文章中440万名学者的分析,我们发现,在所有领域和时间段内,科学家所从事的先前工作的知识年龄与职业年龄成线性关系,这与科学家的“想象力”老化有关。这一过程随着早期的成功而加速,但会随着科学家和学者的发展而逆转:a)向新领域过渡,b)转向新的研究环境,c)与年轻的同事合作。随着年龄的增长,科学家们首先接近表征科学注意力前沿的概念,然后在大约10年后逐渐消失。随着成熟度的提高,科学家们更倾向于通过与自己的对比来保守地批评年轻科学家们的工作,而年龄越大、年龄越大的科学家们的研究进展往往最慢,对新兴的思想和科学家们最为敌视。
[1] Jones, Benjamin F., and Bruce A. Weinberg. “Age dynamics in scientific creativity.” Proceedings of the National Academy of
[2] Sciences 108.47 (2011): 18910-18914.
[3] Packalen, Mikko, and Jay Bhattacharya. “Age and the trying out of new ideas.” Journal of human capital 13.2 (2019): 341-373.
[4] Azoulay, Pierre, et al. “Age and high-growth entrepreneurship.” American Economic Review: Insights 2.1 (2020): 65-82.
重整化群流在计算机视觉的应用
扈鸿业,加州大学圣地亚哥分校博士在读
在过去的⼗年中,我们⻅证了新⼀轮⼈⼯智能尤其是深度学习的迅猛发展。从计算机视觉对图 像分类的监督性学习,到AlphaGo战胜⼈类最⾼棋⼿的强化学习,伴随着新的算法的产⽣,计算机处理器算⼒的加强和⼤量的数据,深度学习在各个领域产⽣了令⼈赞叹的效果,并让我们想象机器在未来的某⼀天会不会也可以像⼈类⼀样产⽣“智能”。对于机器的智能,当我们给它提供很多数据让它进⾏观察后,它是不是也具有这样的能⼒,提取出好的表征,总结成规律呢?对 于让机器在⾮监督的意义下,找到具有解释性的,重要的表征就是我们研究的重点。那么什么样 ⼦的表征我们认为是⼀个好的表征呢?⾸先,如果我们的数据中⼀些特质是相互独⽴的,⽐如形状和颜⾊,那么我们希望对于这些特质的表征是尽可能相互独⽴的,即⾮纠缠的表征 (disentangled representation)。其次,⼤⾃然的信号是分层级的,⽐如理想⽓体可以在⼩尺度 ⽤分⼦位置来描述,但在⼤尺度只需要温度,压强等物理量来描述,我们希望机器具有⾃发处理不同层级信号,压缩信息的能⼒。针对这个问题,我们根据物理思想重整化群提出了多层级的无监督生成模型:RG-Flow,这是无监督学习下一种 新型的网络结构和学习方案。在研究中我们通过人工合成数据,人脸数据,和自然图像数据的研 究展示了它在无监督下建立多层级表征具有很大潜力。并且证明了它在局部信息缺失图像复原问 题上有计算复杂度的降低。
[1] Shuo-Hui Li, Lei Wang, Phys. Rev. Lett. 121, 260601 (2018)
[2] Hong-Ye Hu, Shuo-Hui Li, Lei Wang, Yi-Zhuang You. Phys. Rev. Research 2, 023369 (2020) [3] Hong-Ye Hu, Dian Wu, Yi-Zhuang You, Bruno Olshausen, Yubei Chen. arXiv:2010.00029 (2020)
复杂系统自动建模在大气污染预报与溯源中的应用
王硕,北京师范大学博士在读
随着工业化与城市化进程的加快,大气污染成为当今世界面临的最严峻挑战之一。据世界卫生组织报道,全球每年约有700万人因大气污染而过早死亡。大气污染的溯源及预报能够有效地指导个人的出行及政府的决策,如工厂停产限产、车辆限行等,具有重要的意义。近年来,我国在大气污染防治方面投入了大量的人力物力,但严重的大气污染事件仍然频繁发生。为了促进该领域的研究,国家相继出台了一系列相关的政策。2017年,李克强总理批示设立专项资金,集中攻关雾霾形成机理与防治。2020年,国家自然科学基金委发布基金指南,鼓励从复杂性科学的视角,基于复杂系统的逻辑关系,构建可解释的人工智能新理论框架,解决数字地球大科学等方面的问题。
然而大气污染预报问题具有很大的挑战性,主要表现在以下几点:首先,大气污染是典型的复杂系统,污染物之间会产生复杂的化学反应,生成二次污染物,使得整个系统产生整体大于部分之和的效应;在时间和空间维度均存在长程相关性;此外,融入气象与环境专业的领域知识对该问题的研究至关重要。我们提出了将大气污染数据使用复杂网络的方法进行建模,基于 GNN 构建一个 end-to-end 的空气质量预报模型,其中模型的中间环节给出污染物的来源。
[1]空气污染如何损害我们的健康 https://www.who.int/zh/air-pollution/news-and-events/how-air-pollution-is-destroying-our-health
[2] Song, C. et al. 2019. Modeling Air Pollution Transmission Behavior as Complex Network and Mining Key Monitoring Station. IEEE Access. 7, (2019), 121245–121254. DOI:https://doi.org/10.1109/access.2019.2936613.
[3] Hu, J. et al. 2014. Spatial and temporal variability of PM 2.5 and PM 10 over the North China Plain and the Yangtze River Delta, China. Atmospheric Environment. 95, (2014), 598–609. DOI:https://doi.org/10.1016/j.atmosenv.2014.07.019.
[4] Chen, Z. et al. 2020. Influence of meteorological conditions on PM2.5 concentrations across China: A review of methodology and mechanism. Environment International. 139, (Jun. 2020), 105558. DOI:https://doi.org/10.1016/j.envint.2020.105558.
[5] https://www.epa.gov/cmaq
凯风公益基金会是国家民政部主管的非公募公益基金会。也是首批由企业发起、国家民政部批准设立,并由国家民政部作为上级主管部门的公益基金会。凯风公益基金会主要通过机构合作方式,对在学术研究、政策研究、教育和公益实践方面获得重要成果、具备实力和潜力的学术精英和公益精英,进行资助和奖励,进而达到提升公共福利、增加公众利益、传播公益思想的目的。凯风公益基金会的战略合作伙伴包括国内外顶尖的综合性大学和研究机构、专业艺术院校、国内外一流的NGO。
推荐阅读