首页 » 科学 » 280万瓜分掩码谷歌Open Images数据集再更新_类别_物体

280万瓜分掩码谷歌Open Images数据集再更新_类别_物体

admin 2024-12-03 09:11:32 0

扫一扫用手机浏览

文章目录 [+]

2016 年,谷歌推出了图像数据集 Open Images,互助发布了约 900 万张标注图像,覆盖数千个物体种别。
之后该数据集有过几次更新,末了一次更新是 2018 年的 Open Images V4。
该版本共包括 600 个物体种别及 1540 万个边界框,这使其成为目前具备物体位置标注的最大数据库。
此外,Open Images V4 还为 57 个类供应了 375000 个视觉关系标注。

近日,谷歌发布 Open Images V5 版本数据集(该版本在标注集上添加了分割掩码),并宣告启动第二届 Open Images Challenge 寻衅赛,寻衅赛基于 Open Images V5 数据集增加了新的实例分割赛道。

280万瓜分掩码谷歌Open Images数据集再更新_类别_物体 科学

Open Images V5

Open Images V5 包含 280 万个物体实例的分割掩码,覆盖 350 个种别。
与仅标注物体所在区域的边界框不同,分割掩码标记物体的轮廓,以更高层次的细节描述其空间范围。
谷歌研究者确保不同物体之间的标注同等性(例如:所有猫的掩码都包括它们的尾巴;骆驼或人携带的包袋都包括在骆驼或人的掩码中)。
主要的是,与以往任何数据集比较,这些掩码覆盖更广的物体种别范围和实例总数都更多。

以上是 Open Images V5 演习集的掩码样例。
这些都通过谷歌的交互式分割方法天生。
第一个样例同时标注了边界框作为比拟。

演习集中的(268 万个)分割掩码都是通过谷歌提出确当前最优交互式分割方法天生。
在该过程中,专业的标注职员反复改动分割神经网络的输出结果。
这比纯挚手工绘制更高效,同时还能供应准确的掩码(交并比达 84%)。

此外,谷歌在验证集和测试集上发布了 9.9 万个非常看重质量的手工标注掩码。
它们近乎完美,乃至捕捉到了繁芜物体边界的细微细节(例如:带尖刺的花朵和人造物体中的苗条构造)。
演习集和验证+测试集的标注都供应了频年夜多数现有数据集的多边形标注更准确的物体边界。

以上为 Open Images V5 验证集和测试集的掩码样例,完备由手工绘制。

除了掩码之外,谷歌还为该数据集增加了 640 万个经由人工验证的图像级标签,标签总数高达 3650 万,覆盖近 2 万个种别。
末了,谷歌还改进了验证集和测试集上 600 个物体类别的标注密度,添加了超过 40 万个边界框,以匹配演习集的密度。
这样可以确保能够更精确地评估目标检测模型。

表 1 概述了该数据集中所有子集的图像级标签。
所有图像的图像级标签都由类似于 Google Cloud Vision API 的

打算机视觉

模型自动天生。
此外,该视觉模型已经进行了升级,以适应 V5 数据集版本的较高标签质量。
这些自动天生的标签有相称高的假正例率。

表 1:图像级标签。

此外,验证集和测试集以及部分演习集具备经由人工验证的图像级标签。
大部分验证是由谷歌内部的标注职员完成的。
一小部分由外包职员完成。
此验证过程实际上肃清了假正例(但不能肃清假负例:图像中可能短缺某些标签)。
得到的标签基本上是精确的,谷歌推举将其用于打算机视觉模型的演习中。
谷歌利用多个打算机视觉模型来天生样本(而不仅仅是用于天生标签的模型),使得种别得到显著扩展(表 1 中的 #classes 列)。

总体而言,数据集包含 19,949 个具备图像级标签的不同种别。
请把稳,此数字略高于表 1 中经由人工验证的标签数量,缘故原由是由机器天生的凑集中有少量标签未涌如今人工验证的凑集中。
可演习种别(Trainable classes)指在 V5 演习集中至少含有 100 个人工验证正类的类。
基于这个定义,可演习种别有 8658 个,而机器天生的标签覆盖了个中的 8386 个。

Open Images Challenge 2019

谷歌将在 ICCV 2019 上举行第二届 Open Images Challenge 寻衅赛。
该寻衅赛将基于上述数据增加一条新的实例分割赛道。
此外,与 2018 年的寻衅赛一样,它将包括一个大规模目标检测赛道(500 个种别,1220 万个演习边界框),以及一个视觉关系检测赛道,用于检测成对物体中的特定关系(329 个关系三元组,37.5 万个演习样本,如「弹吉他的女人」或「桌上的啤酒」)。

现在包含所有标注的演习集已经可以利用了:https://storage.googleapis.com/openimages/web/challenge2019_downloads.html

测试集与 2018 年寻衅赛的 10 万张图像相同,将于 2019 年 6 月 3 日在 Kaggle 上开放。
用于评估目标检测和视觉关系赛道的做事器将于 6 月 3 日开放,评估实例分割赛道的做事器将于 7 月 1 日开放。
提交结果的截止日期为 2019 年 10 月 1 日。

标签:

相关文章

语言的形成,从混沌到秩序的演变之旅

语言,作为人类沟通的桥梁,承载着文化的传承、思想的碰撞和心灵的交流。从远古的混沌中诞生,历经千年的演变,语言已经成为人类文明不可或...

科学 2025-01-01 阅读0 评论0

语言的魅力,从辨别到融合的艺术

在人类的历史长河中,语言始终扮演着沟通、传承和创新的角色。不同地域、不同文化背景下,语言千差万别,形成了独特的语言现象。本文将探讨...

科学 2025-01-01 阅读0 评论0

语言的陷阱,如何避免陷入语言漏洞的误区

语言是人类交流的重要工具,但同时也可能成为误导、误解甚至争论的根源。在日常生活中,我们经常会遇到各种语言漏洞,这些漏洞可能导致沟通...

科学 2025-01-01 阅读0 评论0