导读:多类别分类问题在机器学习领域吸引了很多关注,传统的解决方案倾向于将其变为多个二元问题,相应的策略包括决策树、神经网络等等。本文被PRICAI 2016大会收录,提出了一种最大间距二叉树纠错输出码,对应的编码矩阵更加稳定和易识别。
标题:最大间距二叉树纠错输出码
摘要:编码是纠错输出码(ECOCs)中最重要的一步。传统的编码策略通常与数据无关。最近,提出的一些树形编码算法率先利用交互信息预估类间可分性,将二叉树自上而下分层分区,以获得一个编码矩阵。但这些标准通常是由一个非参数方法计算得到,一般来说需要大量样本,而且更可能产生不稳定的结果。本文中,我们提出了一种新颖的编码算法,它利用类间最大间距为基准,构造了一个基于最大间距、自底向上的二叉树。因此,相应的编码矩阵在之后的分类中更加稳定和易识别。实验结果表明在ECOC中,我们的算法比一些最先进的编码算法性能更好。
关键词:多类别分类;最大间距二叉树;纠错输出编码
第一作者简介:
Fa Zheng
东南大学计算机系,教育部计算机网络与信息集成重点实验室。
via PRICAI 2016
雷锋网按: 本文由雷锋网独家编译,未经许可禁止转载!