五年Twitter上情感分析的结果:2008年后总体幸福度呈下降趋势,圣诞节是每年的亮点

Henry · 2013-05-07
情感分析是这些年计算机学中的一个新研究方向,说白了它就是试图将人们的情绪和情感数据化。佛蒙特大学计算实验室的项目Hedonometer在过去的五年中每天都会对 Twitter 上面的千万条 Tweet 进行情感分析,并将其结果记录了下来。

情感分析是这些年计算机学中的一个新研究方向,说白了它就是试图将人们的情绪和情感数据化,手段会包括自然语言处理、统计学、信号处理等。最适合情感分析的平台也是在最近几年兴起的微博类(Microblogging)社交平台,在美国就是Twitter。

佛蒙特大学计算实验室的项目Hedonometer在过去的五年中每天都会对Twitter上面的千万条Tweet进行情感分析,并将其结果记录了下来。Hedonometer主要是通过自然语言处理来分析情感,比如它会在人们的Tweet中寻找一些反映正面情绪或者负面情绪的关键词

我们能从图中看出每一年的幸福度最高点都是12月25号,也就是圣诞节。其它幸福度高的日子包括元旦、感恩节、情人节等。从每周来看,人们平均幸福度最高的一天是星期六,而最低的一天是星期二。

但是自2008年之后,Twitter上面总体的幸福度一直呈下降趋势。这或许是因为2008年的美国金融危机,以及之后导致的持续经济不景气。我们能看到幸福度最低的一天就是上月的15号,也就是波士顿马拉松爆炸发生的那一天。

但是Hedonometer的算法明显是不完美的,因为2011年5月2号是美国宣布奥萨马本拉登被击毙的那一天,但是Hedonometer错误地认为这一天的幸福度很低,因为“死亡”、“杀死”等负面词汇在Twitter上面的频繁出现。完全理解人类的自然语言是一个AI Complete的算法难题。

如果用同样的手段对新浪微博进行情感分析,每年的最高点应该是会在春节。但是还会有哪些其它的区别?

如果对Hedonometer情感分析的具体算法感兴趣,这是此项目的论文全文

+1

好文章,需要你的鼓励

参与评论
登录后才能参与讨论哦...
后参与讨论
提交评论0/1000

请回复有价值的信息,无意义的评论将很快被删除,账号将被禁止发言。

下一篇

今天的“全球移动互联网大会”上,俞永福再次向外界强调,UC浏览器非卖品。比之前更狠的是,俞永福直接喊出,“未来不会听到 UC 被谁收购,而是 UC 收购了谁!”按照俞永福的说法,UC 浏览器作为中国互联网创业的排头兵,如果 UC 倒下了,那么中国互联网创业的前景则会黯淡许多,因此 UC 浏览器愿意做“变量”,并将“变量”进行到底。

2013-05-07

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

为你推送和解读最前沿、最有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚集全球最优秀的创业者,项目融资率接近97%,领跑行业