2020年美国总统大选——基于计算机模拟的选举预测结果与实际结果的比较
作者: 来源:复旦大学复杂决策研究中心
2020年11月1日上午12时许(北京时间),继2016年准确预测台湾地区领导人选举,2018年准确预测美国中期选举中西弗吉尼亚和密苏里两州的联邦参议院选举、以及2018年成功预测台湾地区地方选举中台北、新北和桃园三市的市长选举、2020年准确预测台湾地区领导人选举之后,复旦大学唐世平教授领导的研究团队提前公布了其对于2020年11月3日将要举行的美国第59届总统大选的预测结果。
该预测结果包括基于计算机仿真模拟方法(ABM-based)预测得到的6个州得票率分布,以及6个州ABM预测结果与民调数据结合的全国选举结果。根据历次选举预测的经验,结合政治科学专业知识,并综合考虑美国总统选举制度的独特性,本次预测过程中研究团队对模型和方法做了调试, 并于2020年的4月、7月和9月分别根据不同时期的数据和信息进行了三次实战模拟。团队在公布预测结果时,特别强调,这次预测完全是一种纯粹的学术研究和科学实验,该团队不想以任何方式影响现实中的美国选举。
2020年11月18日(北京时间),美国大选选举计票基本结束,我们就此对比预测结果与正式结果:
(1)6个预测州的结果对比:
注:A组模型与B组模型的一个重要区别是,除了共享的变量之外,前者还包含了各行业(农业、制造业或其他)的就业比例变量,而后者则包含族裔背景变量。
(2)总统大选最终结果对比:
预测成绩和复盘思考:
1、本次我们尝试运用两套不同的仿真模拟模型来预测选举,两套模型都准确地预测了6个州的获胜者。 A组模型与B组模型只有一个关键变量不同,为我们比较不同变量的预测力提供了依据。
2、ABM预测模型与民调数据结合准确预测了总统大选的最终获胜方和选举人团票数的分布区间。
3、我们的初步预测结果在选前7个月已经得出,并根据每个时段的选前变化,在选前4个月和选前1个月分别做了两轮更新,相比于距离选举日最近的各大民调预测,可以发现我们的预测无论在超前性(lead time)和准确性上都有一定优势。
4、不可否认,我们的ABM模型在6个州两党得票率的预测精度上有待提升,普遍低估了特朗普-彭斯的得票率,初步复盘的结论是:1.我们在模型中可能高估了新冠疫情因素的冲击影响;2.由于美国选举的特殊性,我们在模型设定时可能没有充分考虑某些事件对不同人群的投票倾向的影响。对此,我们正在进行相关变量数据的收集和假设检验。
本研究主要采用ABM仿真模拟模型(Agent Based Modeling)来预测选举,其显著特点是依赖真实数据并运用基于行为主体的决策模型,而非依赖于民调结果和专家的个人判断,是选举研究中一次十分有意义的尝试。ABM仿真模拟是一种通过计算机技术进行微观模拟来揭示宏观规律的研究方法。本次预测中,我们进行了大范围、长时段、多维度的数据收集,最终得到美国的人口学数据、投票数据、选民分布数据、经济社会数据、候选人数据、突发事件数据等组成的选举数据库,涵括50多项指标/变量在各个选举年度的相关数据。在仿真模拟过程中,我们力求做到(1)理论和数据交互驱动:选举理论指导预测变量的选取和预测模型的构造,预测结果检验和更新理论;(2)个体层面数据和结构层面数据相结合;(3)长期稳态效应和短期波动效应相结合。
本次预测实践是一项探索选举预测的科学方法并致力于选举预测范式创新和应用的政治学研究。选举预测是社会科学预测性研究的关键议题,是政治学理论和方法创新的前沿领域。基于计算社会科学的选举预测可以帮助我们摆脱对民调、单个专家判断和碎片化新闻报道的过度依赖,深度解析选举政治并研判可能出现的选举结果,在此基础上可以帮助有关部门提前制定应对策略,保护我国国家利益。
为了完成本次预测,复旦大学团队付出了一年多的努力。团队对于原创预测方法的前景表示乐观,唐世平教授认为通过进一步的优化和改进,这种创新方法可能会给全球选举预测和选举研究领域带来转变。
最后,需要指出的是,我们的方法和模型依然处在不断改进和迭代的阶段,每次选举都有新的情势和新的数据出现,每个国家和地区的选举都具有一定特殊性,因此我们的预测方法也面临一些需要攻克的理论和技术难点,本次预测也有诸多值得我们复盘和反思的地方,未来我们还有很长的路要走。
感谢学术同仁和社会各界长期以来对本研究的意见建议、批评监督和支持鼓励。政治科学预测是一项值得探索的科研事业,政治学是一门具有自己的知识体系、方法体系和话语体系的专业学科,期盼同仁们一起努力。
来源时间:2020/11/22 发布时间:2020/11/19
旧文章ID:23531