想要找到一张完美的 GIF 图是一件很难的事。虽然这些内容都可以通过互联网搜索,但从得到的结果来看,仍然有数不清的 GIF 图可供选择。而找一张能准确呈现你想要的效果的 GIF 图就更困难了。目前,一个名为 Giftawk 的全新Web应用,可以相当准确地将语音要求转换成 GIF 格式图片。
这款基于浏览器的应用程序会访问你的麦克风,之后你对着它说话即可。你可以说出任何想要的内容,它会为你找出能反映所说内容的一张或多张 GIF 图,就如下图所呈现的那样。
不过,当你尝试说出完整句子的时候,事情就变得更加复杂了,正如下图所示。
开发者 Adam Lusted 开发的这个应用,使用了 Chrome 的语音识别API。他表示:“我会分拆这些短语,并从 Giphy API (Giphy是一款专搜GIF的搜索引擎)上为每一个字获取相关的 GIF 图。这比较容易,但我不确定它是否可以奏效,毕竟语音识别是一个尖端技术。”
Giftawk 是首批语音转 GIF 程序之一,但它不是唯一一款试图连接语音和动画图像的应用。去年,MIT 媒体实验室推出了 GIFGIF,用多种方式将普通的沟通变成 GIF 图片。它包含了文本转 GIF(输入一些内容,并以 GIF输出),面部转 GIF(相机采用面部分析来生成GIF)。GIFGIF 还可以使用它接收到的数据,将情绪评估加入到 GIF 图中,让我们进一步理解它们。
尽管团队希望看到不同的国家用户如何在 GIF 中使用情绪,但用这一系统大多都是美国人。不过MIT 项目的工作人员 Travis Rich 表示,他们仍利用这些数据得到了一些结论。
Rich 表示,不同的人使用GIF的程度是不同的。很多老年人无法理解为什么会有人在邮件或通讯客户端中使用 GIF,他们能够理解表情符号(emoji),但无法看到的 GIF 中的隐藏含义。例如,他们会将明星跳舞的 GIF 图简单理解为明星本人,而不是图像所要表达的“开心。
如今,GIFGIF 也转而使用 Giphy API 来驱动其应用程序,而这也正是后者希望看到的。负责 Giphy API 集成的 Nam Nguyen 表示:“我们为它设定的目标是,让它可以足够简单地让开发人员把搜索和共享功能,集成到他们开发的应用中。”他指出,有几个类似的项目都在使用 Giphy API,像是 Gifline(翻译邮件中的GIF)和 ZZZine(将你的推文转成GIF)。
不过将文本和语音转换成更加丰富有趣的表达方式,首选并非 GIF,主宰这个领域的是表情符号 emoji——市面上已有无数 emoji 转换服务可供选择。原因可能是,表情符号更容易让人们理解,它们是一种更加紧凑的语言形式。也可能是 emoji 和书面和口头语言一样,都是用 Unicode 来编码。
总体来说,表情符号拥有更多的组合,这意味着它们可以被转换成比单一的 GIF 图更复杂的含义。
从转换目的来看,如果 Google 要扩展其图像识别和标记系统,从而识别 GIF 图片,它可能需要付出很大努力。但emoji 却能以更直接的方式,呈现出更加接近词组或概念的结果。
不过虽然表情符号更容易理解,但并不意味着我们已经对它的含义有了普遍认识。最近一项研究发现,根据地区和语言的不同,每个人对 emoji 的理解也会非常不同。
另外,开发一个优秀的 GIF 转换器需要让它进一步了解我们如何解释图像。有些句子在结构上差不多,但意思却完全不同。让转换器解析这些看似平凡简单的句子,才是真正困难的部分。
GIFGIF 曾做出过一个演示,展示了其识别情绪的能力。如果最终有人能够作出这样的情绪转化为文本的引擎,就可以将这个引擎接入到 GIFGIF 的后端,并更准确地生成表达我们感情的 GIF 图。但现在,至少在搜索功能上,我们只能通过关键词来筛选想要的 GIF 图。
via wired