本月 12 号,一名美国极右翼分子在 Charlottesville 驾驶汽车冲撞反右翼示威人群。
该悲剧发生后,“仇恨犯罪”(hate crime,尤指种族仇恨)四个字被摆到了台面上,成为美国各界人士眼中威胁社会稳定的主要因素之一,不断挑动着全社会的神经。如何对仇恨犯罪进行记录,就成了摆在研究人员、媒体、社科学者面前的一大挑战。而目前,这方面的数据要么不完整,要么根本不存在。
怎么解决?
谷歌给出的答案是机器学习。
雷锋网消息:与 ProPublica、Pitch Interactive、纽约时报、BuzzFeed、the Southern Poverty Law Center 以及迈阿密大学合作,谷歌新闻实验室推出了一个基于 AI 算法的新闻分析工具:Documenting Hate News Index(记录仇恨新闻指数)。它将对全美的仇恨犯罪进行监控。
谷歌表示,"Documenting Hate News Index 能导入过去六个月的谷歌新闻文章,利用谷歌云自然语言 API 创建一个可视化工具,帮助媒体监控全美的新闻事件。它的起始点是今年二月,从该时间点往后不断更新数据。对于仇恨犯罪而言,这是一个非常合理的监控起始时间点。(雷锋网按:特朗普在今年 1 月下旬就任总统)"
该工具能把包含“仇恨犯罪、倾向或辱骂行为”内容的新闻文章整合起来。这包括反犹太涂鸦,以及相关司法诉讼案件。谷歌将对该数据集进行监控,确保其他新闻事件不会被错误的包括进来,例如仅仅包含关键词“仇恨”的新闻。
Documenting Hate News Index 的用户可按日期搜索,或按关键词。谷歌的算法会推荐相关关键词,比如犯罪嫌疑人的姓名、发生地点以及犯罪类别。
雷锋网获知,为保证信息的时效性,该工具会每日更新。第三方研究人员可从 Google Trend 的 Github 主页 获取该工具。
当然,任何基于新闻的统计数据都有其局限性——不幸的是,社会中的大多数犯罪事件不会得到报道。仇恨犯罪也是一样,被媒体写成文章的更少。不过,谷歌的工具仍能为新闻工作者和研究人员,提供一些更清晰的仇恨犯罪现象观察。
via the next web