来源:Google AI blog,新智元

基于深度学习的现代计算机视觉模型(比如由TensorFlow对象检测API实现的模型)的性能取决于是否可以使用规模越来越大的标记训练数据集(如公开的图像)进行训练。

然而,如何获得高质量的训练数据,正迅速成为计算机视觉领域的主要瓶颈。这对于自动驾驶、机器人和图像搜索等应用中使用的语义分段的像素预测任务而言尤其如此。

实际上,传统的手动数据标记工具,需要标记者仔细点击图象边界,来划定图像中的每个对象,这很乏味:在COCO + Stuff数据集中,标记一个图像需要19分钟,而标记整个数据集需要53000小时!

COCO数据集中的图像示例(左)及其逐像素语义标记(右)。图片来源:Florida Memory

本文中的内容将在2018年ACM多媒体会议“勇敢新理念”环节中展示,谷歌的研究人员研究了一种机器学习驱动的界面,可用于标注分类数据,划定图像中每个目标的轮廓和背景,让标记数据集的生成速度提高至原来的3倍。

该工具名为流体标注(Fluid Annotation),从强语义分割模型的输出开始,人工标记者可以使用自然用户界面,通过机器辅助编辑操作进行修改。谷歌此次开发的界面可以让标记者选择要修改的内容和顺序,使他们能够高效地将精力集中在机器尚不了解的内容上。

对COCO数据集中图像使用流体标注界面的可视化。图片来源:gamene

更确切地说,为了对图像进行标记,我们首先通过预训练的语义分割模型(Mask-RCNN)来处理图像。这会生成约1000个图像片段及其分类标签和置信度分数。置信度分数最高的片段用于对标签的初始化,呈现给标记者。

然后,标记者就可以:(1)从机器生成的候选标签中为当前片段选择标签。(2)对机器未覆盖到的对象添加分割段。机器会识别出最可能的预生成段,标记者可以从中选择质量最高的一个。(3)删除现有段。(4)改变重叠段的深度顺序。(Demo链接在此:,仅限桌面平台)

使用传统手动标记(中列)和流体标注(右)在COCO数据集的三张图像上进行标记的比较。虽然使用手动标记工具时,目标的边界一般更准确,但标记差异的最大原因是人类标记者通常对某一确切的对象分类有不同意见。来源:sneaka(上),Dan Hurt(中),Melodie Mesiano(下)。

流体标注是让图像标注变得更快、更容易的第一步探索。未来的目标是改进对目标边界的标记,进一步利用机器智能提升界面的速度,最终实现对界面的扩展,能够处理以前无法识别的分类,实现最高效、需求最大的数据收集。

而实际上,关于这款工具的论文的预印本早在近一个月前就发在了arxiv上。

论文地址:

参考链接:

-annotation-exploratory-machine.html

1.限时下载 | 800G人工智能全套学习资料,超级干货! Hot~

2.限时下载 | Python+Matlab+机器学习+深度神经网络,仅限500人! Hot~

3.限时下载 | 100G Python从入门到精通全套资料!(全网最全) Hot~

4.限时下载 | Matlab从入门到进阶学习资料大放送,全是干货! Hot~

5.限时下载 | 140G编程资料免费领!(python、JAVA、机器人编程...)

6.限时下载 | 学习Python、机器人编程必读的10本书籍!

7.限时下载 | 265G python全套视频教程,从入门进阶到面试技巧! Hot~

8.限时下载 | 40G Matlab从入门到精通全套学习资料大全!

9.限时下载 | 一本豆瓣9.4分的好书《流畅的Python》!

10.限时下载 | 一本数据分析入门必读《利用Python进行数据分析》

11.限时下载 | 110G C语言和C++编程全套自学教程,仅限500人!

12.限时下载 | 20G Python量化交易从入门到精通全套资料!

OFweek 2018(第三届)中国

高科技产业大会

(深圳站)

OFweek 2018(第三届)中国高科技产业大会将于11月12日-13日在深圳举办,今年主论坛的核心议题将聚焦人工智能、医疗科技、新能源,并延伸至智能产业前瞻性话题,带来机器人、智慧城市、物联网、智慧照明、智能光伏、氢能、锂电、新能源汽车等多个领域最具尖端性、科技感的议题,带来数十个专场技术峰会

小编温馨提示:扫码报名即可进入2018中国高科技产业大会福利群,抢1500元福利门票!

免费领取2018中国高科技产业大会门票

戳下面的原文阅读,也能抢票!