雷锋网AI科技评论按:研讨会开了几天,IJCAI 2017正会终于要开始了,接下来的几天将是一系列激动人心的特邀演讲和各种奖项的确定和颁发。
在明天早上的开幕典礼上,将从6篇入围的论文中确定期待已久的两项Distinguished Papers奖。这6篇论文当中,3篇Distinguished Student Paper全是华人学生的论文,而Distinguished Paper中也有一篇是中国学者的工作。所以前一个奖项已经被中国学生包了,后一个也很有可能会是中国学者获奖。在颁奖之前,我们不如先来了解一下这六篇论文内容,然后押上一宝,明天看能否猜中哪家获奖。
1)使用Limit Datalog程序的声明数据分析的基础
下载地址:https://arxiv.org/pdf/1705.06927.pdf
雷锋网注:分析复杂数据目前是非常热的话题,这种分析,例如数据聚合、属性验证或查询回答等,现在主要是通过指定如何操作数据来完成,但是当数据较为复杂时这种方式表现并不是很好。现在有人提出数据分析应当被声明,也就是说用户应当描述期望输出是什么,而不是怎么计算它。例如,在一张图中,不是通过具体的算法来计算最短路径,而是应当1)描述什么是路径长度;2)选择最小长度的路径。
在数据分析中,近来有人提出了声明数据分析(declarative data analysis)方法,这种方法一个重要组成部分就是能够捕获相关任务的有效语言,Datalog_Z(支持递归)是其首选,但是这种语言是不可判定的。我们通过引入limit Datalog_Z并对使用乘法进行约束,事实蕴涵在聚合中将变得conExpTime-完整,在数据复杂性中变得coNP完整。此外,额外的稳定性要求会导致复杂性分别下降到ExpTime和PTime。最后我们展示了稳定的Datalog_Z可以用来表达许多数据分析任务,所以我们的这些结果将为高级信息系统的开发提供一个坚实的基础。
2)全局游戏策略(GGP)中基于约束的对称检测
下载地址:https://www.ijcai.org/proceedings/2017/0040.pdf
雷锋网注:全局游戏策略,General Game Playing,是斯坦福大学组织的一个比赛。每年一搞。GGP是一个电脑系统可以靠描述在一定“运行时间”内独自进行策略游戏。换句话说,它们不知道规则直到游戏开始。不像专门对应于一个游戏的,例如深蓝,全局游戏策略不是依赖特定的算法来对应特定的游戏;它们必须令程序自己开发算法。全局游戏策略依赖于玩这个游戏的智能本身而不是那个设计这个程序的程序猿的脑子。
对称检测是减少游戏搜索树的一种有前途的方法。在全局游戏策略(GGP)中,任何一种游戏都是由游戏描述语言(GDL)中的一组规则表示出来的,而对称检测的最佳方法则依赖于与游戏的GDL描述有关的规则图。虽然这种基于规则的对称检测方法可以应用于各种树搜索算法,但它们仅涵盖在GDL描述中显而易见的有限数量的对称性。在本文中,我们开发了一种替代方法,这种对称检测方法是来自于利用约束编程技术的随机游戏。GDL游戏中的极小值优化问题在此变成了随机约束满足问题(stochastic constraint satisfaction problem, SCSP),可以将其视为一级SCSP序列。Minimax对称性由这些一级约束网络的微结构的补集推断出来。基于这种方法的理论分析,我们用实验方法展示了多种游戏,最近的随机约束求解器MAC-UCB,加上基于约束的对称性检测,显著地优于标准的蒙特卡洛树搜索算法+基于规则的对称性检测。这种约束驱动的方法也通过我们的队员在最近一次GGP比赛中获得的出色成绩得到了验证。
3)通过知识片段转移的一般异构迁移距离度量学习
下载地址:https://www.ijcai.org/proceedings/2017/0341.pdf
雷锋网注:迁移学习(Transfer learning) 顾名思义就是就是把已训练好的模型参数迁移到新的模型来帮助新模型训练数据集。考虑到大部分数据或任务是存在相关性的,所以通过迁移学习,我们可以将已经学到的参数分享给新模型,从而加快并优化模型的学习,不用像之前那样从零开始。
迁移学习旨在利用其他相关任务的信息(迁移知识)来提高目标学习任务的表现。最近,迁移距离度规学习(transfer distance metric learning, TDML)引起了很大的兴趣,但是大多数这类方法都假设源和目标学习任务的特征表示是一样的。因此,他们不适用于数据来自异构域(特征空间、模态和事件语义)的应用程序。虽然现在有一些异构迁移学习(heterogeneous transfer learning,HTL)方法能够处理这样的问题,但它们在实际的程序中缺乏灵活性,且学习迁移也通常被限制为线形的。所以,我们在此开发了一种基于知识片段迁移策略的异构TDML(HTDML)框架,这种框架更为通用且更为灵活。在我们的HTDML中,可以使用任何(线形或非线性)的距离度规学习算法来学习预先准备好的源度规,然后从源度规中提取一组知识片段来帮助目标度规学习。此外,不管是线形还是非线性的距离度规都可以从目标域中学习。通过大量对场景分类和对象识别的实验,证明了我们所提出的这种方法的优越性。
1)用于对象图像重新渲染的标记解脱生成对抗网络
下载地址:https://www.ijcai.org/proceedings/2017/0404.pdf
雷锋网注:标记解脱生成对抗网络(Tag Disentangled Generative Adversarial Networks,TDGAN)
在本文中,我们提出了一个原理性的标记解脱生成对抗网络(TDGAN),用于通过指定多个场景属性(如视点,照明,表情等)从单个图像重新渲染出感兴趣对象的新图像。整个框架由解离网络(Disentangled Network),生成网络(Generative Network),标签映射网络(Tag Mapping Net)和辨别网络(Discriminative Network)组成,它们基于完全/部分标记的给定图像集(即监督/半监督设置)来联合训练。给定一张输入图像,解离网络将提取解离的、可解释的表示,随后生成网络将用它来生成图像。为了提高解离表示的质量,于是在我们的框架中集成了标签映射网络来探测图像与其标签之间的一致性。此外,引入辨别网络以实现用于生成更逼真图像的对抗训练策略。两个有挑战性的数据集实验证明了这种框架在这些问题上的优良表现。
2)使用Stein效应的数据驱动随机傅立叶特征
下载地址:http://static.ijcai.org/proceedings-2017/0207.pdf
雷锋网注:Stein效应——假设有n个向量变量{x_j},这些变量是从一个p(p>3)维、平均值为μ的多变量正态分布中抽取出来的样本。那么μ的最有效的估计值不是<x>(样本平均值),而是由James和Stein在在1961年提出的估计量(James–Stein estimator或收缩估计量)。
大规模内核近似是机器学习研究中的一个重要问题。Rahimi等人使用随机傅里叶特征的方法现在变得越来越受欢迎,其中核近似被视为通过蒙特卡罗或准蒙特卡罗积分的经验平均估计。这种方法的局限性在于,所有的特征都获得相等的权重(总和为1)。在本文中,我们提出了一种“Stein效应”的新的收缩估计器,这种估计器将为随机特征提供一种数据驱动的加权策略,并在降低经验风险方面提供了理论依据。我们进一步提出了一种有效的随机算法用于所提方法的大规模应用。我们对六个基准数据集的实证结果表明,这种方法在内核近似和监督学习任务中都比典型方法表现得更好。
3)多任务CNN的个性化显著性预测
下载地址:https://www.ijcai.org/proceedings/2017/0543.pdf
雷锋网注:个性化显著性预测,Personalized Saliency Prediction,PSP
显著性检测是计算机视觉中长期存在的问题。大量的工作都集中在探索不分性别、种族、年龄等差别的具有普遍性的显著性模型。然而最近的心理学研究表明,个体在观看包含多个显著物体的同一个图案时会表现出差异性。 在本文中我们首次表明,这种异质性对于可靠的显著性预测是常见的和决定性的。 我们的研究还生成了首个个性化显著图(PSMs)的数据库。我们基于不同参与者共享的通用显着图(USM)来为PSM建模,并采用多任务CNN框架来估计PSM和USM之间的差异。 综合实验表明,我们新的PSM模型和预测方案是有效且可靠的。
相关文章:
中科院计算所王永庆详解IJCAI 17录用论文:如何用注意力机制RNN进行信息传播建模?|IJCAI 2017