如何控制美国不断发酵的仇恨犯罪？谷歌推出机器学习监控工具

谷歌机器学习仇恨犯罪

作者：三川

2017/08/19 06:01

如何控制美国不断发酵的仇恨犯罪？谷歌推出机器学习监控工具

本月 12 号，一名美国极右翼分子在 Charlottesville 驾驶汽车冲撞反右翼示威人群。

该悲剧发生后，“仇恨犯罪”（hate crime，尤指种族仇恨）四个字被摆到了台面上，成为美国各界人士眼中威胁社会稳定的主要因素之一，不断挑动着全社会的神经。如何对仇恨犯罪进行记录，就成了摆在研究人员、媒体、社科学者面前的一大挑战。而目前，这方面的数据要么不完整，要么根本不存在。

怎么解决？

谷歌给出的答案是机器学习。

雷锋网消息：与 ProPublica、Pitch Interactive、纽约时报、BuzzFeed、the Southern Poverty Law Center 以及迈阿密大学合作，谷歌新闻实验室推出了一个基于 AI 算法的新闻分析工具：Documenting Hate News Index（记录仇恨新闻指数）。它将对全美的仇恨犯罪进行监控。

谷歌表示，"Documenting Hate News Index 能导入过去六个月的谷歌新闻文章，利用谷歌云自然语言 API 创建一个可视化工具，帮助媒体监控全美的新闻事件。它的起始点是今年二月，从该时间点往后不断更新数据。对于仇恨犯罪而言，这是一个非常合理的监控起始时间点。（雷锋网按：特朗普在今年 1 月下旬就任总统）"

该工具能把包含“仇恨犯罪、倾向或辱骂行为”内容的新闻文章整合起来。这包括反犹太涂鸦，以及相关司法诉讼案件。谷歌将对该数据集进行监控，确保其他新闻事件不会被错误的包括进来，例如仅仅包含关键词“仇恨”的新闻。

Documenting Hate News Index 的用户可按日期搜索，或按关键词。谷歌的算法会推荐相关关键词，比如犯罪嫌疑人的姓名、发生地点以及犯罪类别。

雷锋网获知，为保证信息的时效性，该工具会每日更新。第三方研究人员可从 Google Trend 的 Github 主页获取该工具。

当然，任何基于新闻的统计数据都有其局限性——不幸的是，社会中的大多数犯罪事件不会得到报道。仇恨犯罪也是一样，被媒体写成文章的更少。不过，谷歌的工具仍能为新闻工作者和研究人员，提供一些更清晰的仇恨犯罪现象观察。

via the next web