导读:近年来,微博已经成为了人们最常用的网络社交工具之一,所以对微博中的信息进行挖掘是非常有价值的。因为图片具有快捷方便的天然属性,只用图片发布微博是一个新的趋势。目前大多数微博的情绪分析研究都聚焦在文本,已经不能适用。利用机器学习技术对图片进行情绪分析是实现高级人机交互的重要部分,对于实现人机交互、人—计算机接口以及智能计算机等有重要意义,这已成为目前模式识别、机器学习和认知科学等研究领域的热门研究课题之一。
标题:基于多核学习整合文本信息的微博图片情绪分析
摘要:微博上,图片是表达用户情绪最重要的方式之一。越来越多的人在微博上只发布图片,因为图片具有快捷方便的天然属性。只用图片发布微博是一个新的趋势。目前大多数微博的情绪分析研究都聚焦在文本,或是把图片作为融入文本中的辅助信息,所以它们在这种情况下不适用。尽管已经提出了一些有关图片的情感分析方法,但其中绝大多数都忽略了低阶视觉特征和高阶图片情绪间的语义差距,或在训练和推理阶段需要大量的文本信息。本文提出了一种基于简单多核学习(SimpleMKL)的新型情感分析方法。具体来说,文本信息作为一种丰富的情感源数据,我们可以利用它来提高SimpleMKL分类图片的能力。一旦我们得到图片分类器,当预测其他未标记的图像时就不需要任何文本。实验结果表明,该方法在爬虫获取的数据和新浪微博标签的数据上都效果显著。我们发现该方法不仅优于一些常见方法,如支持向量机,朴素贝叶斯、KNN,随机树,演算法等等,也优于目前一些基于颜色,梯度,纹理等图像特征的先进方法。
关键词:情绪分析;微博;图片情绪;多核学习
第一作者简介:
Junxin Tan
南京大学,计算机系,新型软件技术省重点实验室。
via PRICAI 2016