: 观点隐藏的学霸之魂：Zero-Shot Learning如何打破“零起点”的封印？观点 | 2018-12-25 09:02 脑极体

回顾一年来CV技术的产业化进程，算得上是红红火火恍恍惚惚。

2018年还剩不到10天，回顾一下今年CV（Computer Vision，计算机视觉）领域的进展，在技术上并没有迎来什么革命性的新突破。

几个头部企业的业务重点，除了强化现有算法的精度，更多还是将精力投掷在商业布局上。

似乎每家公司都在为这个看得见的“赛点”争分夺秒地发掘新应用场景。

不过，还是有很多新技术的进步值得我们专门用一篇文章来说一说，比如今天要讲的Zero-Shot Learning。

毕竟，当场景被开发到极限，大家就又回到了技术的起跑线。

什么是ZSL？

零样本学习zero-shot learning，是最具挑战的机器识别方法之一。2009年，Lampert 等人提出了Animals with Attributes数据集和经典的基于属性学习的算法，开始让这一算法引起广泛关注。

之所以如此重要，因为其迥异于传统图像识别任务的思考方式。

从原理上来说，ZSL就是让计算机具备人类的推理能力，来识别出一个从未见过的新事物。

举个例子，我们告诉一个从没见过斑马的小朋友：“斑马是一种长得像马，身上有黑白色条纹的动物”，他就可以很轻松地在动物园里找出来哪个是斑马。

可是，在传统的图像识别算法中，要想让机器认出“斑马”，往往需要给机器投喂足够规模的“斑马”样本才有可能。而且，利用“斑马”训练出来的分类器，就无法识别其他物种。

但是ZSL就可以做到，一次学习都没有，只凭特征描述就识别出新事物，这无疑离人类智力又近了一步。

那么，这种“天秀”到底是怎么工作的？

简单说的话，就是利用高维语义特征代替样本的低维特征，使得训练出来的模型具有迁移性。

比如斑马的高维语义就是“马的外形，熊猫的颜色，老虎的斑纹”，尽管缺乏更多细节，但这些高位予以已经足够对“斑马”进行分类，从而让机器成功预测出来。

这就解决了图像识别长久以来的问题：如果一个事物从来没有在现有数据集中出现过，机器应该如何学习和识别它。

听起来是不是很爽很智能的样子，实际上也确实如此！

ZSL的“优越感”来自哪里？

在CV领域的顶会CVPR 2018 会议中，一个关于使用鉴别性特征学习零样本识别的论文，被认为代表了该领域当前的最佳水平。

之所以受到如此重视，主要源于近年来零样本学习（ZSL）在目标识别任务中的大显身手。

由于ZSL所挑战的现实情境前所未有地苛刻，使其具备了影响其他图像识别效果的关键能力。

现有识别技术大多集中于监督学习，所以需要不断推出更大的数据集，谷歌曾介绍说他们在用300Million的3D图片进行训练。而且，每个领域还需要各自的数据集。

这种情况下，全部进行数据标注的工作量也变得很大，很多新生事物更是想标注都无从谈起。这样在部署端的效率和成本就成了产业的“不可承受之重”。

那怎么办呢？科研人员只好努力让机器学会“花更少的钱，办更多的事”。

以腾讯AI Lab的研究为例，其“Diverse Image Annotation”，就是充分利用标签之间的语义关系，用少量多样性标签来表达尽可能多的图像信息，实现自动标注。

ZSL则更为极端，要在一个样本都没有的前提下“空手套白狼”，这种极限挑战，就给技术界带来了新的活力。

首先，ZSL降低现有算法对数据集的依赖和标注的压力，有利于提升机器视觉技术的亲和力及部署效率；

另外，现在产业端对缩减算力需求的呼声日渐高涨，ZSL清晰有效地指向了可行的解决方案；

更重要的是，ZSL解决的不仅仅是视觉问题，更与NLP的发展相辅相成。根据模糊高维的语义描述去进行识别，对机器的要求不仅仅是简单分类，还要理解特征一些人类的高级知识，比如一种艺术作品的风格、一种特殊的情绪等。找到这种语义上的联系，将机器视觉与NLP技术联合在一起解决问题，ZSL激发的技术想象很是有趣。

都说“数据是AI的燃料”，那没有燃料是不是就注定GG？ ZSL表示可以续命，就是这么得瑟！

从0到1：ZSL和OSL有何不同？

这时，想必很多关注技术趋势的同学可能已经发现了，零样本学习与少样本学习（OSL，One-Shot Learning）在最终的应用成果上，似乎作用很相近啊。

比如说，都指向了高层次的认知问题。只要给OSL一张“斑马”的图片，它就能很高效地将它从其他动物中鉴别出来。背后靠的也是从很少的标签中学习、分类和推理的能力。

在应用端，因为都不依赖庞大的数据集，两种模型都能帮助产业的AI识别实现降本增效。

按理说，既然零样本是少样本的子集，那么是不是可以直接套用ZSL的模型来解决OSL的问题呢？

其实是可以的。毕竟“从没见过”与“见过一次”相比，“从0到1”的技术难度要求更高。

不过，二者并不能轻易地被替代或划等号，各自的研究都很有意义。