正在阅读:从美国大选说起 数据帮助总统同时怎样帮助我们从美国大选说起 数据帮助总统同时怎样帮助我们

2016-11-27 00:15 出处:其他 作者:佚名 责任编辑:zhangxiaomeng

  大数据为候选人“贴标签”

  在美国大选当中,大数据技术来通过对海量的候选人数据收集和分析,分别给每一个候选人贴上了“标签”,正是这些标签决定了幸福指数等相关数据的分值高低。在希拉里与特朗普的“标签”对比中,通过对词语的颜色根据感情状态区分开来,越趋近于蓝色代表越快乐,越接近紫色则代表越悲伤,而这些词语的大小由加权平均tf-idf值决定。如此一来,根据不同候选人的大数据进行分析得出的一些结果,确实能够给大众选民们提供一些投票的建议。

  在候选人的“标签”方面,希拉里所具备的词汇基本上以经验、才能、女性、世界、调查、谎言等为主;而特朗普的标签词汇则基本都是些前进、胜利、羞辱、攻击、危险等一类词汇。

  在通过数据分析将数据进行收集和分析之后,针对不同候选人所得出的词汇,美国的一些大数据技术网站还会将这些词汇进行转移,并制作成参照分布的示意图,同时会把不同候选人的参照分布进行相似度对比。通过对比,希拉里的词汇转移图与参照分布比较相似,达到了5.76比5.77,负面词汇包括电子邮件调查及“监狱”,“犯罪”,“囚犯”,“丑闻”等。

  “票据”是以负面形式呈现的词汇(被理解为支付票据),但是在希拉里这里则是指比尔·希拉里。正面词汇主要有“她”,“女性”,“感谢”,“健康”,而负面词汇“憎恨”,“悲伤”,“失败者”,“诈骗”,“种族主义”较少被提及。

  而拥有最高幸福指数的特朗普,其正面词汇有伟大、爱、美国、更好等等。显而易见,这些词汇都与他的竞选口号等内容相关。他的负面词汇包括憎恨、种族主义、失败者、禁止等等,这也从另一方面反应了他的反对者对他所持的观点和看法。

键盘也能翻页,试试“← →”键
本文导航
第1页:概述
第2页:大数据为候选人贴标签
第3页:数据团队起到关键作用

为您推荐

加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
IT热词
热门排行

服务器论坛帖子排行

最高点击 最高回复 最新
最新资讯离线随时看 聊天吐槽赢奖品