在研究生研究研讨会上:一种模拟Twitter政治和“假新闻”的算法
李成的研究为政治分析人士提供了一套新的工具,可以用来理解社交媒体在决定选举中的作用,但他对自己能带来什么很坦率。
“我们不是政治学家,”他说。“我们是计算机科学家。”
李是威廉玛丽大学计算机科学系的博士生。他与该系助理教授刘振明(Zhenming Liu)合作了一个项目,该项目展示了一种可能是迄今为止最好的方式,可以模拟Twitter上政治互动的漩涡和喧嚣。
李因其工作被授予诺斯罗普·格鲁曼公司奖。该奖项旨在表彰自然科学和计算科学领域的杰出学术成就。他将与其他获奖的William & 玛丽研究生一起参加3月24日至25日在William & 玛丽的Sadler中心举行的第16届年度研究生研究研讨会。
这个计算机科学项目包括一种研究“假新闻”如何通过社交媒体传播的方法。李指出,Facebook和Twitter因影响英国脱欧和美国总统选举等国家决策而受到广泛赞誉和指责,但对社交网络在决策过程中所起作用的分析仍然是“投机和粗糙的”——尽管社交媒体已经流行了十多年。
“我们想弄清楚推特用户的政治倾向,”李说。
他补充说,美国似乎有一种政治两极分化的趋势,有证据表明,左倾的个人倾向于更左。右倾的人似乎也有同样的倾向。
“有了社交媒体,这种趋势甚至变得更加严重,”李说。“因为左倾的人永远不会看到来自中间偏右来源的新闻,即使它可能是正确的、有道理的,因为他们的朋友不会分享这类新闻。”
在数据科学术语中,他们的项目是一个“稀疏图”挑战,在数据点之间提供相对较少的连接。李说,稀疏图问题是数据科学家无法准确模拟社交媒体互动的根本原因。他说,他的项目已经产生了一种可行的算法,适用于随机块模型和小世界模型——两种描述“节点”相互关系的数学方法。
李的项目关注的是美国总统大选前后的时间。
他说:“我们的数据只关注去年10月到去年11月这两个月。”“我们的关系图是稀疏的。这里也有噪音。那么我们如何在排除噪声的同时还能从稀疏图中得到一些意义呢?”
在Li的项目中,节点是单独的Twitter用户。他的算法为研究中1200万Twitter用户中的每个人的政治倾向构建了一幅数学肖像。这种画像被称为“潜在变量”,是通过映射每个用户与其他用户的互动来构建的:他们甚至不需要阅读每条推文。
计算机科学家通过“实地调查”来检验他们的工作,建立了一个现实世界的基础来测试他们对Twitter政治格局的建模。他们向威廉和玛丽政府部门的一位成员寻求帮助。
“事实上,当我们开始这个项目时,我们不确定我们是否提出了最好的政治科学问题,”李说。所以我们向Jaime Settle(助理)教授寻求帮助。塞特尔教授给了我们宝贵的反馈,这让我们相信我们正朝着正确的方向前进。”
他说,塞特尔在自己的研究中广泛研究社交媒体问题,她向计算机科学家提供了建议,建议他们使用对第114届国会议员投票记录和共同赞助法案的在线分析数据。
李通过将他的模型与真实的矩阵进行对比,证实了他的模型的预测能力。他补充说,该算法进行了其他测试,表现优于竞争对手的方法。
李和刘还用他们的模型对推特上“假新闻”的传播进行了简要研究,结果显示,研究中最右的10%用户占了大部分假新闻的数量。李小心翼翼地指出,作为“电脑人”,他们在这个领域走得很小心。
“假新闻是我们工作的一个应用,但我们对假新闻并不是特别感兴趣,”他说。“我们没有时间去核实是假新闻还是真新闻。”
他们分析的一个方面不会让人感到意外:唐纳德·特朗普(Donald Trump)主宰了Twitter的所有领域。李说,在两个政治极端,对特朗普相关推文的反应都是最高的。
“特朗普的反应形成了一个近乎完美的u型曲线,”他说。他说:“极右翼和极左翼反应强烈。然后双方的支持率平均下降到中间路线的低点。”