大多数人看过一两次某样物体就能将它认出来,而计算机视觉和语音识别的算法则需要成千上万的例子才能够熟知某个新图像或者新词语。今天有外媒报道,谷歌的研究人员找到了一个办法,绕过这些学习过程。
谷歌DeepMind的研究人员对深度学习算法进行了一些巧妙的调整,使得它根据单一的样本就能够识别图像中的物体。这一过程被称作“一次性学习”。该团队在大量添加标签的图片和包含单词的纸张上做了相关的实验,成效还不错。
要知道目前最准确的那些算法虽然能够有效地识别物体,但由于其对数据的巨大需求,它们的开发相当耗时,且成本高昂。例如,想要让算法识别出道路上的汽车,就需要为其提供成千上万个例子才能在无人驾驶汽车中实现可靠的准确率。
谷歌DeepMind研究员奥里奥尔·温亚尔斯在深度学习系统中增加了一个记忆组件,该团队利用一个名为ImageNet的标记图片数据库对该系统的能力进行了验证。这套软件仍然需要分析数百种图片,但此后却可以学会用一张照片识别新的物体。
本质上它是通过分析图片中的独特元素来完成识别任务的。这种算法只需要看一个例子,便可达到近似于传统深度学习系统的准确率。
温亚尔斯表示,该算法能够快速理解新词的意思,这项研究尤其有用。他指出,这对于谷歌而言意义重大,因为它可以让系统快速学习新搜索词的意思。
当然,在专业人士看来我们还远未能够揭开人类进行一次性学习的奥秘。机器的学习能力要跟上人类还需要一定的时日,但这项进展显然促进了人工智能学习能力的进步。