数据学习
AI博客
原创AI博客
大模型技术博客
期刊会议
学术世界
期刊出版社
领域期刊
SCI/SCIE/SSCI/EI简介
期刊列表
会议列表
所有期刊分区
学术期刊信息检索
JCR期刊分区查询
CiteScore期刊分区查询
中科院期刊分区查询
管理 - UTD24期刊列表
管理 - AJG(ABS)期刊星级查询
管理 - FMS推荐期刊列表
计算机 - CCF推荐期刊会议列表
南大核心(CSSCI)
合工大小核心
合工大大核心
AI资源仓库
AI领域与任务
AI研究机构
AI学术期刊
AI论文快讯
AI数据集
AI开源工具
数据推荐
AI大模型
国产AI大模型生态全览
AI模型概览图
AI模型月报
AI基础大模型
AI大模型排行榜
大模型综合能力排行榜
大模型编程能力排行榜
OpenLLMLeaderboard中国站
AI大模型大全
大模型部署教程
在线聊天大模型列表
2023年度AI产品总结
Identifying expertise and using it to extract the Wisdom of the Crowds
小木
Management Science
2014-03
1845
2017/02/06 09:57:43
这篇文章主要是说如何聚合大众智慧来帮助我们预测事件。我们知道,计算机领域中的bagging和boosting方法可以将不同的算法聚合得到较好的结果。其理论原理也在之前Leo Breiman的论文中有数学证明。随着近几年互联网的快速发展,利用网络获取一般用户的判断来辅助我们预测也是一个比较火热的话题。这些研究领域可能包括预测市场(Prediction Markets)、众智(Wisdom of Crowds)、众包(Crowd Sources)等。 #### 简介 在预测未来的过程中,有一个简单的方法是征求大众的意见。然而,很多文献都证明个体的判断充满了偏差,比如系统性的极端或者是过分自信自己的判断。弥补这个问题的一个方式是寻求领域专家的配合来减少偏差。然而,专家本身就是很难定义的,也不容易被识别出来。尽管在某些领域中,专家有很高的预测准确率,但这并不是所有的情况。因此,我们可以采取另一种方式,即通过获取大量的一般个体的判断,然后从数学上联合不同的意见并最终产生预测结果。也就是说,我们要依靠专家和一般用户(knowledgeable experts and plain volunteers)一起预测结果。Davis等人将众智(wisdom-of-crowds, WOC)的影响定义成一般个体的线性联合结果,要比随机选择的个体判断结果准确。 Sir Galton等人在随后的研究中发现,尽管没有哪一个个体可以准确的预测,但是所有个体的中位数(the crowd's median)却可以很好的判断结果。众智的表现取决于事实是否趋近于大量个体判断的中心趋势。如果事实在大众观点的中心区域,简单的聚合就可以得到较好的结果。否则,众智只能等于或略好于一般的评价,但并不是最好的。 Budescu等人认为,聚合不同来源的信息非常具有新引力:1)最大化决策的有信息;2)减少潜在的极端的信息来源;3)通过更加包容的生态化的表示来提高聚合的可信度。有趣的是,聚合不需要“专家”,一般个体即可。 批评众智的人认为由于系统偏差的存在,大众并不能很好的传递出自己的判断。于是,很多研究者采用带权重的模型来平衡专家和一般个体的判断,以减少系统偏差的影响。在这篇文章中,作者提出了一个权重的方法,来判断一般个体的贡献,用以评价一般个体的预测能力。这个方法通过识别最好的或者是最差的判断个体来探索众人的多样性。作者通过一系列实验来验证带权重的模型是否可以比简单的聚合信息效果要好。 #### 众智(Wisdom of the crowd) 众智的前提是个体的知识(信号)可以被抽取出来,同时偏差(biases)和错误信息(噪音)(misinformation/noise)可以被消除。众智要求个体是具有知识的,并且可以通过激励来促进个体表达自己信念,且个体之间是相互独立的。防止系统偏差的方法有很多。 #### 聚合概率预测 聚合个体的判断包括两个方面:行为上的聚合和数学上的聚合。行为上的聚合是指我们寻求一个一致性的概率,个体不断的与系统交互并得到反馈,然后修订自己的预测。但行为的聚合有个问题是在几次交互之后仍然获取不到一个一致的判断结果。数学的聚合方法则是根据个体报告的预测概率,通过数学建模的方式,获取聚合结果。这里也包括两类方法:一是贝叶斯方法(Bayesian aggregation)和观点池(权重模型,opinion pools/weighting models)。贝叶斯方法将个体的判断结果看作是数据,然后根据一个适当的似然函数,通过贝叶斯公式求得聚合结果。这个方法最困难的是寻找合适的似然函数,并获取一个适当的先验概率。作者在这篇文章中使用的是观点池的方法。(搞管理的搞贝叶斯还是难了点,作者自己说的贝叶斯太难了,所以搞观点池。。呵呵呵呵,接下来作者描述都是观点池怎么做的了,我要去找贝叶斯的方法,所以不看了)。
赏
支付宝扫码打赏
如果文章对您有帮助,欢迎打赏鼓励作者
Back to Top