本周日上午9:00,“因果科学与Causal AI”读书会将进行第十三期的线上论文分享,主题是“因果科学在工业界的前沿应用”,将由Etsy的数据科学家XuanYin和南洋理工大学博士在读,同时也在达摩院工作的汤振华分享因果科学在工业界的一些前沿应用,的本次内容将在集智俱乐部B站直播,欢迎大家扫码报名,获取提醒。


 



Solving Interference in Marketplace Experiments




Xuan Yin,Data Scientist in Etsy,研究方向为因果推理。



许多的电子商务公司的主营业务是线上市场。这包括线上批发市场,例如阿里巴巴;线上零售市场,例如Amazon,eBay,Etsy;共享经济,例如Uber,Lyft,Airbnb。这些电子商务公司如同其他的互联网公司一样,以随机实验来估计检验Average Treatment Effect(online A/B tests),从而做出业务决策,例如:是否应该采用新的算法来支持产品,新的产品带来了多少利益,等等。然而,在市场经济中,Average Treatment Effect (ATE)的识别(identification)通常难以成立。这是因为市场经济的特点,例如:卖家的策略,商品的互补性或替代性等等,破坏了ATE identification中的stable unit treatment value assumption (SUTVA)。具体而言,这指的是,对于一个实验个体来说,无论它是处于treatment还是control,它的potential outcomes都会依赖于别的实验个体的treatment status。比如,为了比较两个定价算法,A和B,对平均销量的影响,我们随机地为一群销售相似产品的卖家分配定价算法。考虑两个卖家和两种分配情景:情景一:卖家甲的价格受到算法A的影响偏低,情景二:卖家甲的价格受到算法B的影响偏高。那么,无论卖家乙是处于算法A还是算法B,它的potential销量在情景一的时候必定比在情景二的时候低。换句话说,卖家乙的potential销量受到了卖家甲的treatment status的影响。这种情况被称为interference,是破坏SUTVA的情况之一,使得随机实验无法识别ATE。在这次的读书会中,我会介绍现阶段的工业界的市场实验是如何尝试去解决interference。

推荐参考文献 

Abadie, Alberto. 2019. “Using Synthetic Controls: Feasibility, Data Requirements, and Methodological Aspects.” Journal of Economic Literature. 
Doudchenko, Nick, Minzhengxiong Zhang, Evgeni Drynkin, Edoardo Airoldi, Vahab Mirrokni, and Jean Pouget-Abadie. 2020. “Causal Inference with Bipartite Designs.”  
Holtz, David, Ruben Lobel, Inessa Liskovich, and Sinan Aral. 2020. “Reducing Interference Bias in Online Marketplace Pricing Experiments.” 
Lechner, Michael. 2011. “The Estimation of Causal Effects by Difference-in-Difference Methods.” Foundations and Trends® in Econometrics 4 (3): 165–224. https://doi.org/10.1561/0800000014. 
Saveski, Martin, Jean Pouget-Abadie, Guillaume Saint-Jacques, Weitao Duan, Souvik Ghosh, Ya Xu, and Edoardo M Airoldi. 2017. “Detecting Network Effects: Randomizing Over Randomized Experiments.” In Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 1027–35. KDD ’17. New York, NY, USA: Association for Computing Machinery. https://doi.org/10.1145/3097983.3098192. 
Saint-Jacques, Guillaume, Maneesh Varshney, Jeremy Simpson, and Ya Xu. 2019. “Using Ego-Clusters to Measure Network Effects at LinkedIn.”

 




A Causal View of Bias in Computer Visionvv




汤凯华,南洋理工大学,研究方向为计算机视觉。



随着近年的技术发展,目前基于深度学习的机器学习系统在很多计算机视觉领域的任务中都取得了比肩甚至超过人类的准确率。然而这种看似强大的性能却被限制于非常有限的场景和环境中,任何测试数据的扰动,不管是分布上的还是数据本身的新噪声,都会严重地影响模型的泛化性能。这其实归因于,目前的深度学习模型,在处理图像和语言数据时,其内部学习的机制无法被理解,也就是所谓的黑盒系统。而这种对中间学习过程没有任何有效约束和解释性要求的模型,往往会在训练中竭尽所能的利用数据的任何信息,也就包含了大量的非因果效应的伪相关,比如如果雪豹总是出现在雪里,模型识别雪豹所依赖的特征可能就不是雪豹本身,而是去识别雪地环境。因此,为了解决上述问题,增加机器学习的泛化性能,我们MReaL实验室近年开始尝试运用因果分析中的概念和思想,去重新认知我们现有的视觉模型,并通过基于因果分析的改进来去除已知的伪相关(spurious correlation),提取其直接因果效应(Direct Effect)。目前我们提出的方法,在场景图生成和通用的长尾分布下的分类、检测和分割等问题上,取得了明显的提升。大大降低了模型给出不公平决策的可能性。

 

 

Reference

[1] Tang, Kaihua, et al. “Unbiased scene graph generation from biased training.” Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2020.
[2] Tang, Kaihua, Jianqiang Huang, and Hanwang Zhang. “Long-tailed classification by keeping the good and removing the bad momentum causal effect.” Advances in Neural Information Processing Systems 33 (2020).
[3] Niu, Yulei, et al. “Counterfactual VQA: A Cause-Effect Look at Language Bias.” arXiv preprint arXiv:2006.04315 (2020).
[4] Yang, Xu, Hanwang Zhang, and Jianfei Cai. “Deconfounded image captioning: A causal retrospect.” arXiv preprint arXiv:2003.03923 (2020).
[5] Zhang, Dong, et al. “Causal intervention for weakly-supervised semantic segmentation.” Advances in Neural Information Processing Systems 33 (2020).
[6] Yue, Zhongqi, et al. “Interventional few-shot learning.” Advances in Neural Information Processing Systems 33 (2020).


直播信息与报名方式


直播时间:本周日(12月20日) 9:00-12:00


参与方式 1:腾讯会议(需报名参加系列读书会)

参与方式 2:集智俱乐部B站直播


扫描下方二维码,点击「我要听」报名,内附B站直播地址。




关于读书会内容介绍的更新


集智俱乐部联合智源社区发起了因果科学与Causal AI读书会受到了因果科学领域一线科研工作者的广泛认可,我们也深深的感受到了青年科学工作者推动该领域发展的热情。目前因果科学与Causal AI读书会已经有220+的朋友报名,其中硕博的比例接近80%。

 

在读书会中的参与者以科研工作者居多,清华大学、北京大学、国防科技大学、浙江大学、复旦大学、中山大学等国内高校的学生居多,也有许多一线互联网包括谷歌X、FackBook、滴滴、腾讯、阿里、拼多多等大厂的工程师也参与其中。


             

欢迎大家加入其中,现在加入读书会的成员将会作为因果社区的种子用户长期运营,将可以免费享受集智俱乐部后续因果相关主题的读书会,如果你心动了,就点击下面的链接报名吧~

 

时间:9月20日起,每周日晚19:00-21:00,持续约2-3个月
模式:线上闭门读书会;收费-退款的保证金模式;读书会成员认领解读论文
费用:299/人

 

了解读书会具体规则、报名读书会请点击下方文章:

因果科学与 Causal AI 系列读书会 | 众包出书


目前读书会已经有超过130余人的海内外高校科研院所的一线科研工作者以及互联网一线从业人员参与,如果你也对这个主题感兴趣,就快加入我们吧!


针对读书会的主题,由发起人龚鹤扬设置好了内容框架,每个主题下有一个负责人来负责维护组织相关内容,目前已经定好的如图所示,欢迎对主题感兴趣的联系相关负责人,以及来认领相关主题~



推荐阅读


点击“阅读原文”,来报名吧~