计算社科|SocioX 2022 课程介绍
1. 领域介绍
1. 领域介绍
想必大家多少都有过这样的经历:一觉醒来,朋友圈突然都在转发同一篇推文,讨论同一件事情。
不管是上海疫情的话题、前段时间的“铁链女”事件,以及风靡社交网络的谷爱凌,还是早些时候的“Black Lives Matter”“Metoo”运动,这些影响力巨大的话题似乎都能在极短时间内占领我们的公共讨论空间。
你有没有想过,为什么这些话题会突然爆火?是它们更能引起人的共鸣吗?还是它们反映的社会现象特别普遍吗?究竟是什么造成了这种全国乃至世界范围内的大规模“人传人”现象?
图源:sitapix
社会传染现象(Social Contagion)是社会学中一个重要的研究领域,是指某些观点、态度、行为或是产品被大规模地接受,俗称“火了”(go viral)。
一个话题为什么会火?这是社会科学研究者关注的点;也是商业公司想要用来遏制丑闻发酵或者卖出更多产品的关键;社会活动家们也想知道现象背后的秘密,以便获得更大的公众影响力。
但对于这样复杂的问题,我们该如何寻找研究的切入点呢?
在很多人看来,所谓的社会科学家,就是去和民众聊天,然后通过逻辑思考分析来理解世界、理解社会、也理解我们自己,并著书立说以传播他们的想法。
这只属于研究方法的其中一种,也是千百年前的先贤们曾努力做过的事情,他们也的确为我们留下很多深刻且宝贵的社会思想。
但在瞬息万变、日益复杂的现代世界,在信息时代大量堆积的内容材料面前,光靠个人经验去做研究的方式,不可避免地带有很大的局限性。
现在的社会科学家用的最多的也是基于统计学的计量实证方法。实证方法为社会科学带来了大规模的样本收集和统计分析。统计学的严谨解读使得社会科学的研究结果能够被验证,从而似乎拥有了被信任的资本。
然而,传统的实证方法也遇到重重阻碍:首先,依靠问卷收集的数据信息耗时长、工程量大而数据有限;其次,社会科学的研究成果一直难以从相关关系走向因果关系:我们尚且难以完全理解事物之间的联系与行为背后的逻辑,要做出预测就更难了。
于是,一批社会科学家的目光转向了最前沿的计算领域。机器学习与人工智能帮助我们分析巨量文本,大幅提升了社会科学理论的外部效度。而复杂系统等理论也给了梳理千头万绪的社会关系一种新思路,让我们能同时分析百万量级的关系网。
前沿的计算方法之于社会科学研究者而言,犹如显微镜与望远镜,它能够帮助我们看到我们曾看不到的微小与宏观。
我们来看看计算理论是如何更好解决一些社会科学问题的吧!
对于我们开头提到的消息扩散中的“人传人”现象,传统实证方法收集到的数据呈“S”型(如下图所示)。
实证社会科学研究中社会扩散现象的数据模型
这对应着一种阈值模型理论(Granovetter 1978),即事物首先在人群中的一部分中扩散,在达到某个阈值时,开始加快扩散速度,直到整个群体被覆盖。但这样的数据模型存在两个缺陷:
首先,我们只能看到宏观层面累计的数字,而无法得知个体层面具体的“传染”结构,因而无法得知本次扩散现象具体的机制;另外,能够被从宏观层面观测到的扩散现象,已经是成功的扩散现象。然而如果我们想知道,到底什么事情会扩散什么事情不会扩散,就应当也能够研究失败的扩散现象。
计算社会科学则拥有解决上述问题的潜力。互联网为我们留下了史无前例的大规模行为数据和痕迹数据,而计算机则有能力处理这些大规模数据,使得我们不仅能够看到个体层面的机制,也能看到宏观层面的机制。
研究者基于对不同社交平台(包括推特,雅虎等)的数据分析,发现信息传播的结构仅有如下几种(如下图所示)。
社交平台上信息内容的传播结构
这是一种和传统实证研究数据收集完全不同的视角——个体层面的信息传播结构。研究者发现*,在推特上发布一条推文,93% 的情况下不会有任何人转发,5% 的情况下有一个人转发,0.9% 的情况下有两个人转发,仅在 0.3% 的情况下,该内容有大规模传播的潜质。
*注:出自 Computational Social Science: Progress & Future Challenges by Duncan Watts | DataEngConf NY ’16
尽管我们不能由此得出计算社会科学方法先进于传统实证研究方法,但我们可以看到,网络大数据与计算机的数据处理给我们提供了看待问题新的视角。
新的视角,往往蕴藏着接近真理的可能性。对计算科学与社会科学交叉所孕育的奇妙,你是否也感到欣喜与好奇?我们无比期待和你一起探究如何来探索更多未解决的问题。
2. 课程介绍
2. 课程介绍
从简单分类和回归问题到推特的舆情分析,基于机器学习的研究方法得益于大数据和持续增长的计算机算力,在社会科学领域展现出空前的影响力。
当传统手段面对大数据效率不足或难以提升精准度时,机器学习可以更好地探析各种变量间的隐含关系,为社会问题的研究和政策设计提供新颖的角度和工具。
今年 SocioX 2022 的计算社会科学课程将从理论基础开始,带领大家了解支持向量机、随机森林等经典机器学习算法,以及神经网络等深度学习方法在自然语言处理、数据挖掘等实战项目中的应用,并在真实社科研究中锻炼大家模型选择、参数调整和结果分析的能力。
我们会介绍社科领域的理论思想,带领学员利用 Python 和一系列 Python Libraries 复现计算社科经典论文中的模型,鼓励大家用最新的算法研究成果改进文中的方法,逐步锻炼数据处理能力。
拥有这些实战经验后,学员们将有机会在导师和学术领袖们的指导下,开展自己感兴趣的研究项目,如分析 B 站视频评论区的舆情风向,探究一个词的语意如何在媒体文本中演进等。
3. 导师介绍
3. 导师介绍
4. 学术领袖
4. 学术领袖
5. 申请信息
5. 申请信息