导读:ECAI 2016是欧洲展示AI科学成果的最佳场所,大会为研究人员提供了很好的机会,去介绍和听取当代最优秀的人工智能研究成果。
摘要:组稀疏表示(GSR)利用了数据中的组结构,并在许多问题上效果很好。 然而,该组结构必须事先手动给出。在许多实际情况下,如分类,样本都是根据他们的标签进行分组的。在这种情况下,构建一个一致的组结构确实不容易。其原因有:1)样本可能被错误地标记;2)标签分配到大数据中非常费时且成本高。在本文中,我们提出并制定了一个新的问题,用半监督组稀疏表示(SS-GSR)支持标记和未标记数据中的组稀疏表示。同时学习一个更强大的组结构,它可以被进一步利用以更有效地代表其他未标记的数据。我们开发了一个模型来解决SS—GSR问题,它基于子空间分割中的流形假设,即同一组中样本特征空间紧密联系在一起且跨越相同的子空间。我们还提出了一个交替算法来解决模型。最后,我们通过大量的实验验证了该模型。
Longwen Gao
任职:上海市智能信息处理重点实验室,复旦大学计算机科学院博士
研究方向:数据挖掘,人工神经网络,人工智能
相关学术论文:
·“Effectively classifying short texts by structured sparse representation with dictionary filtering”
本文中,我们提出并制定了半监督GSR(SS-GSR)对含标记和未标记的数据集进行组稀疏表示。它可以克服传统GSR的两大缺陷:1)在GSR中预定义组结构可能与数据中不完全一致;2)GSR中未利用未标记数据的潜在组结构。相比于GSR,SS-GSR可以利用标记数据的先验组结构和未标记数据的组结构信息。相比于SSL方法,SS-GSR可以从数据中自动的学习结构化亲和矩阵,而不是使用一个固定的。
我们将SS-GSR应用于监督和半监督分类任务,验证了SS-GS的有效性和优越性。
via:ECAI 2016
PS : 本文由雷锋网独家编译,未经许可拒绝转载!