Nature封面文章: DeepSeek-R1 通过强化学习激励的LLM推理
导语
就在刚刚,一篇题目为:《DeepSeek-R1 通过强化学习激励大型语言模型进行推理》(DeepSeek-R1 incentivizes reasoning in LLMs through reinforcement learning)的文章登上了Nature,而且还是封面文章。
关键词:LLM推理、强化学习、规则化奖励
JK丨作者
张倩丨编辑
这篇文章的作者人数,竟然达到了将近200人,真可谓集体智慧之作。
...
- 2025-09-17
信息与计算视角的智能传播 | 周六直播·AI×传播读书会
导语
在AI快速发展的当下,AI不仅深刻影响着信息传播的方式,也为传播学研究带来了全新视角和方法。基于此,集智俱乐部联合北京师范大学许小可教授、浙江大学张子柯教授、南京大学王成军教授、深圳大学廖好副教授共同发起“AI×传播”读书会,从计算叙事、智能传播、人机传播与传播仿真四个板块向来共同探索AI与传播的前沿交叉,来深度理解传播机制和传播生态。
...
- 2025-09-17