导语


当我们遇到困难时,常会说“换个角度看看,可能会有新的思路和发现”。

那么对于在机器学习的领域研究者来说,推荐你了解下范畴论,作为数学的数学,范畴论的思维方式和分析视角,可以帮助增强你的直觉和洞察力。可能会在你身处泥沼,百思不得其解时,帮你建立更好的问题表达方式和解决思路。经过多年的发展,范畴论不再是“抽象的废话”,而是可以用公式或者其他数学表达方式明确指导具体研究。范畴论和机器学习的结合,是一个在蓬勃发展的新领域。

集智学园联合日本成蹊大学助理教授贾伊阳,推出「范畴论与机器学习」系列课程,带领学生从范畴观点切入机器学习,包括对机器学习的某些方法论建立背景的具体范畴的研究方法,以及从神经网络架构等出发研究在范畴上的某些结构,例如“层”,“纤维”,“topos”等的研究方法。课程将从2024年2月26日开讲,欢迎对此感兴趣的朋友加入。2024年2月29日前加入享八折早鸟价优惠,早加入享优惠。




范畴论是什么?




Martin Kuppe曾绘制了一幅精美的数学地图,范畴论高高悬挂天空,照耀着数学的各个领域。它让我们看到看似不相关的数学领域之间也存在某种关系。当想解决某个领域问题,但是尚没有合适的工具可用时,就可以将问题转移到不同的领域,换个角度来看问题,说不定就会发现新的工具来解决问题。20世纪40年代诞生的范畴论,就是这样产生的,背景就是人们试图用更简单的代数方法来解决一个困难的拓扑问题。

在范畴论发明前,并没有系统化的跨领域联系的方法论,许多科学的进展都依靠科学家天才的联想能力。如今,范畴论得到了系统化的发展,成为一门研究结构与关系的学问,它可以看作是集合论的一种自然延伸:在集合论中,一个集合包含了若干个不同的元素;在范畴论中,我们不仅记录了元素,还记录了元素与元素之间的关系。范畴论的一个主要信条就是,一个数学对象完全由它与所有其他对象的关系决定

范畴论被称为数学的数学,为现代数学提供了一套基础语言。它早已不是外界所认为的带有神秘色彩的智力游戏,可以用公式或者其他数学表达方式明确指导具体研究。许多数学界的研究人员放下了历史包袱,愿意在自己的研究领域体会范畴论的思想,在代数几何、数论、乃至分析等方面开拓疆土。不仅如此,物理学家、计算机科学家、语言学家、系统科学研究者等也纷纷投入范畴论在各自领域的应用中。





机器学习中的范畴论




我们来通过一个具体的案例,看如何在机器学习中应用范畴论。Kenneth D. Harris 在2019年的一篇文章中构建了一个框架,可以利用范畴论的概念来描述学习算法的不变性。学习算法可以表述为:训练数据集函子𝓓和预测模型函子𝓟 之间的自然变换。

给定一个输入空间的范畴𝓧,一个输出空间的范畴𝓨,以及一个索引范畴𝓘:

𝓓: 𝓧×𝓨×𝓘op→Set 将一个(输入,输出,索引)元组映射到所有可能的训练数据集的集合。
𝓟: 𝓧×𝓨×𝓘op→Set将一个(输入,输出,索引)元组映射到所有可能的预测函数的集合。

Harris 将不变学习算法定义为一个从𝓓到𝓟的自然变换μ。算法定义了一系列函数,每个函数将一组训练数据集映射到一组预测函数。然后他根据满足这种自然性条件的范畴论𝓧,𝓨,𝓘来表征学习算法。在线性回归算法中,𝓧表示有限维向量空间和可逆线性映射的范畴,𝓨表示有限维向量空间和线性映射的范畴,以及𝓘表示欧几里得空间和单设的范畴。利用范畴论可以将结论进行非常直观的形式化的呈现,例如在线性回归中,不同的预测变量可以具有任意的尺度等。

范畴论与机器学习的交叉是一个令人兴奋且富有潜力的研究方向。将范畴论的概念和方法与机器学习相结合,可以为机器学习领域带来新的理论和实践进展,同时也可以为范畴论提供更广阔的应用领域。这一交叉研究还处于初级阶段,仍然存在许多挑战和待解决的问题。但正是这种交叉研究的努力和探索,有望为机器学习领域带来新的突破和进展,同时也为范畴论的应用领域拓展开辟新的道路。





系列课程简介




为了帮助大家对范畴论与机器学习这一交叉领域有深入的了解,理解机器学习方法背后的范畴意义,集智学园联合日本成蹊大学助理教授贾伊阳,推出了「范畴论与机器学习」系列课程,旨在面向机器学习领域并且希望深入到理论思想层面、身在数学领域想要利用人工智能解决问题的、以及希望了解一些范畴论应用前景(例如和人工智能、量子计算融合的可能)的研究者,科普机器学习前沿领域论文中出现的范畴论知识。

本系列课程将以机器学习与范畴论的报告、论文和教材为课程材料,介绍其中的重要概念,以及更重要的是在这些概念背后隐藏的思想。从范畴观点切入机器学习,包括对机器学习的某些方法论建立背景的具体范畴的研究方法,以及从神经网络架构等出发研究在范畴上的某些结构,例如“层”,“纤维”,“topos”等的研究方法。这些繁琐的术语,复杂的概念如果从纯粹数学的角度出发,全然理解要耗费数年时间。本课程的主要目的是引导大家在避免过度消耗精力的同时快速了解这些概念和范畴架构在机器学习理论及应用中的意义





主讲老师




贾伊阳,日本成蹊大学助理教授。研究重点是计算复杂性,算法,以及范畴相关理论。




课程框架与大纲




课程框架


课程大纲与简介

第1课:信息的传播:从序理论到范畴

课程简介:

从研究者的角度看,探索未知对象的方法包括两种,一种是把这个对象拆分成原子对象,即不可再拆分的对象,通过研究这些成为原子对象的部分来研究这个对象,这是集合论的思想;另一种是研究这个对象和其他对象之间的“关系”,从而构建出关于这个对象的种种性质的全局的架构,这是范畴论的思想。范畴中强调彰显关系的“箭头”。集合论的思想,实际上能够囊括在范畴论的思想之中。我们将所谓“原子对象”组成“分子”,再组成更大的“结构”,这一过程反映了以未知对象的各级子对象的组成的序。更广泛地,在信息科学中,信息的分解与整合构成序,信息的流动同样构成序。将序的动态过程用箭头描述,就和范畴的理论脱不开渊源。在这节课中,我们将介绍能够非常自然地描述信息科学中各种过程的序,并将这个概念延伸到更加抽象的范畴理论。

主要内容包括:

(1)序理论的基本知识:关系、预序、伽罗瓦连接等

(2)和范畴相关的概念的意义:幺半预序、对称性、预序的充实等

(3)一些信息科学中的具体例子

第2课:范畴论基本概念:箭头的学问

课程简介:

范畴广泛出现在数学,物理,以及哲学之中。研究范畴的学科称为范畴论。范畴论在数学的几乎所有分支中都发挥了重要作用,层理论等作为现代数学的重要分支,通过研究某个对象和其他对象之间的关系而研究对象,同时符合深度神经网络等中常见的以网络结构学习的思想。另一方面, 当代范畴论提出了范畴的若干推广, 包括 ∞-范畴的概念, 及由此引出了高阶同伦的思想,高阶关系的构成,提示了许多可能的机器学习的方法论。https://github.com/bgavran/Category_Theory_Machine_Learning?tab=readme-ov-file这一网页中给出了关于范畴思想的机器学习的数十篇论文。为了深入理解它们的思想,本节给出我们学习时必不可少的一些范畴中的初等概念,为大家后续理解论文做好铺垫。

主要内容包括:

(1)如何将数据的集合和数据间的关系统一视为范畴

(2)范畴、函子、自然变换的定义、理解及例子

(3)J-图、极限、余极限、神经的定义、理解及例子

(4)伴随函子、单子等的介绍与具体例子

第3课:机器学习理论常用范畴

课程简介:

本节总结机器学习论文中常见的范畴思想,介绍普遍适用的背景范畴,以及常用的具体的范畴,同时深入探讨为什么以这些范畴为背景进行不同机器学习方法论的研究。

主要内容包括:

(1)幺半范畴、充实范畴

(2)笛卡尔微分范畴,引入了光学及透镜的范畴

(3)马尔可夫范畴、准Borel范畴、Kleisli 范畴

(4)(有限)度量范畴

第4课:基于梯度的方法的范畴化

课程简介:

本节中介绍基于梯度的机器学习方法,尤其是神经网络的范畴化理论。主要串联下列论文中的思想,比较其中定义的范畴并寻找一致性,同时提供给大家现阶段尚未解决的开放性问题。

  • Categorical Foundations of Gradient-Based Learning

  • Backprop as Functor

  • Lenses and Learners

  • Reverse Derivative Ascent

  • Dioptics

  • Learning Functors using Gradient Descent

  • Compositionality for Recursive Neural Networks

  • Deep neural networks as nested dynamical systems

  • Neural network layers as parametric spans

  • Categories of Differentiable Polynomial Circuits for Machine Learning

第5课:概率方法的范畴化

课程简介:

本节中介绍依赖概率的机器学习方法(如贝叶斯算法等)的范畴化理论。给定的固定数据集下,大多数机器学习问题可以归结为优化问题。而有效解决机器学习问题需要对数据集的来源和限制进行推理。这种机器学习模型中的随机不确定性可以由概率和贝叶斯推理所建模,从而使得监督学习从一个函数逼近问题转变为一个分布逼近问题。通过引入范畴论,可以推理一些范畴内部的随机性,帮助理解概率学习泛性质,并阐明与其他领域的联系。

本节主要串联下列论文中的思想,同时提供给大家现阶段尚未解决的开放性问题。

  • Markov Categories and Entropy

  • Infinite products and zero-one laws in categorical probability

  • A category theory framework for Bayesian Learning

  • Bimonoidal Structure of Probability Monads

  • Representable Markov Categories and Comparison of Statistical

  • Compositional Semantics for Probabilistic Programs with Exact Conditioning

第6课:不变性和等变性学习的范畴化

课程简介:

本节中介绍机器学习的不变性和等变性学习方法的范畴化理论。这一方向的研究集中于机器学习算法的保持对称性的特性。可以使用多种工具来探索数据集的变换与在这些数据集上运行的机器学习模型的输出之间的关系。而许多工具中的范畴论思想非常鲜明,如函子和自然变换。

本节主要串联下列论文中的思想,同时提供给大家现阶段尚未解决的开放性问题。

  • On Characterizing the Capacity of Neural Networks using Algebraic Topology

  • Persistent-Homology-based Machine Learning and its Applications – A Survey

  • Topological Expressiveness of Neural Networks

  • Functorial Manifold Learning

  • Isomorphism, Normalizing Flows, and Density Estimation: Preserving Relationships Between Data

第7课:层,拓扑斯与机器学习

课程简介:

除了定义具体的范畴来研究具体的机器学习方法论之外,也可以泛化地将机器学习中蕴含的思想与现代数学中的前沿代数几何、高阶拓扑及逻辑等联系起来。这一方向深入探讨了数学角度的机器学习中一些网络的基础架构(主要是深度神经网络)与思想,并可能启发基础方法的革新。

本节主要介绍Laurent Lafforgue等人的工作,总结其提出的一些具有启发的思想。

第8课:深度神经网络中的拓扑斯与叠
课程简介:
本节主要介绍论文Topos and Stacks of Deep Neural Networks(arXiv:2106.14587)的主要思想。这一论文从现代数学的角度深入探讨了神经网络中蕴含的结构及其“涌现”特性背后的数学思想。简而言之,每个已知的深度神经网络都对应于一个Grothendieck拓扑中的对象,而层中的不变性结构对应于 Giraud stack。本节将用浅显的大家可以理解的方式介绍这些概念及其在机器学习中的对应。



课程推荐阅读材料




  1. 第1-3课重点参考:Seven Sketches in Compositionality: An Invitation to Applied Category Theory https://math.mit.edu/~dspivak/teaching/sp18/7Sketches.pdf

  2. 第4-6课重点参考:Shiebler, Dan, Bruno Gavranović, and Paul Wilson. “Category theory in machine learning.” arXiv preprint arXiv:2106.07032 (2021). https://arxiv.org/abs/2106.07032

  3. 第7课重点参考:https://www.laurentlafforgue.org/Expose_Lafforgue_topos_AI_ETH_sept_2022.pdf

  4. 第8课重点参考:Belfiore, Jean-Claude, and Daniel Bennequin. “Topos and stacks of deep neural networks.” arXiv preprint arXiv:2106.14587 (2021). https://arxiv.org/pdf/2106.14587.pdf   https://arxiv.org/abs/2106.14587

  5. [黎景辉2014] 高等线性代数学。本书以线性代数的思维主线,从矩阵的具体运算发展到抽象代数中的模和模范畴,引入同调代数的方法,最后以范畴论结束。本书以较高的视角重新审视基础的线性代数,需要读者对线性代数、抽象代数有所温习。

  1. [李文威2019] 代数学方法(卷一:基础架构)。本书是中文出版观点较为现代的代数学教程,全书贯穿了范畴论的思维方式。对于初学者本书有一定难度,可配合市面上常见的大学代数教材一起学习。

  1. 学习工具推荐nLab:https://ncatlab.org/nlab/show/HomePage,这是一个关于数学、物理和哲学领域的维基百科,从更高层次的观点来看待问题,包括对同伦论/代数拓扑、同伦类型论、高阶范畴论和高阶范畴代数等工具和视角。

  2. 学习工具推荐香蕉空间:https://www.bananaspace.org/wiki/%E9%A6%96%E9%A1%B5,一个正在成长的中文数学社区。包括数学百科与数学讲义的网站,但采用更广泛的数学观点,区别于nLab着重范畴论观点。





课程信息




课程目的

本系列课程的目的是帮助大家能快速理解范畴论的概念和框架在机器学习理论及应用中的意义,看到范畴论与一些前沿领域,如AI和量子计算融合的可能性。


课程适用对象

  1. 机器学习领域并且希望深入到理论思想层面;

  2. 身在数学领域想要利用人工智能解决问题的;

  3. 希望了解一些范畴论应用前景(例如和人工智能、量子计算融合的可能)。

 

对学员基础要求

本课程旨在尽可能降低范畴论的难度。学员只需对高等代数/线性代数中的线性空间、线性映射、矩阵运算有基本了解。


报名须知

一、学费
本次课程学费 599 元。(可开发票)
早鸟价格:479元(八折优惠),优惠截止时间:2024年2月29日。

二、参与形式
此次系列课程为周更课程,共计 8 节,从2024年2月26日起,每周一 19:30 开课,共计8周,三个工作日内上线课程录播。
课程链接:https://campus.swarma.org/course/5305

三、报名途径
点击下方二维码购买课程:
扫码付费报名课程

支付宝与微信支付均可付费。付费后,请在课程详情页面,扫码二维码填写“学员登记表”,填表结束后,会弹出课程助教微信二维码,添加助教微信,即可加入课程交流群,与老师同学互动。购买课程可开发票。


加入VIP,解锁集智课程&读书会


集智长期深耕复杂系统与跨学科研究,在网络科学、系统理论、混沌科学等经典领域持续策划精品课程,同时也追踪因果科学、深度学习、复杂经济学、生命复杂性、社会计算、AI+Science、大模型、神经科学、城市科学等交叉前沿。汇集了大量的探索者,包括教授、硕博、工程师、创业者等等。

为了帮助有学习需求的朋友夯实学科基础,帮有科研需求的朋友深入前沿交流,我们开放了1年制和2年制的集智学园VIP计划。VIP用户可以深度参与集智俱乐部社区,并在会员期内解锁集智学园全站课程权限。

更多关于VIP介绍,请点击查看:
加入集智学园VIP,一次性获取集智平台所有内容资源



推荐阅读:

  1. 大模型的能力边界在哪里?来自范畴论视角的答案

  2. AI 为什么会有创造力?范畴论刻画大模型创造力的来源

  3. 智能是什么?范畴论为通用人工智能提供普适框架

  4. 当自然语言处理遇上量子计算与范畴论:人工智能开启更大想象空间

  5. 范畴论:数学的数学

  6. 一分钟数学:范畴论

  7. 构建数学和物理基础的范畴论:用「等价」取代「相等」

  8. 通用人工智能(AGI)已经到来?深度解析 ChatGPT 获得智能的数学物理机理

  9. 思维的极限:科学的进步将取决于人类还是AI ?

  10. 人人可学的范畴论——跨领域的科学方法论 | 精品入门系列课

  11. 人人可学的范畴论第二季——跨学科的科学方法论 | 精品入门系列课


点击“阅读原文”,报名课程