Google lanza el conjunto de datos Open Images V4 y el desafío de imagen pública abierta de 1,9 millones de imágenes

El 30 de abril, Google publicó un documento en su blog oficial en el que indicaba que abriría la base de datos Images V4 y abriría el CCTV 2018 Open Image Challenge al mismo tiempo.

Aquí está la información recopilada proporcionada por Google sobre las imágenes abiertas en el blog.

En 2016, lanzamos un conjunto de datos, Open Images, que contiene aproximadamente 9 millones de imágenes y etiqueta miles de categorías de objetos. Después del lanzamiento, hemos estado trabajando arduamente para actualizar y mejorar los conjuntos de datos para proporcionar un recurso útil para que la comunidad de visión por computadora desarrolle nuevos modelos.

Hoy nos complace anunciar la apertura deAbrir imágenes V4, que contiene 15,4 millones de cuadros delimitadores para 600 categorías en 1,9 millones de imágenes,que es el conjunto de datos más grande existente con anotaciones de ubicación de objetos. La mayoría de estos cuadros son dibujados manualmente por comentaristas profesionales, lo que garantiza su precisión y coherencia. Además, estas imágenes son muy diversas y a menudo contienen escenas complejas de múltiples objetos (8 imágenes por imagen en promedio).

Al mismo tiempo, también anunciaremos el lanzamiento de laDesafío de imágenes abiertas, que será un nuevo desafío de detección de objetos en la Conferencia Europea de Visión por Computadora de 2018 (ECCV2018). El Open Images Challenge seguirá las tradiciones dePASCAL TU,ImagenNetyPALMA DE COCO,pero su escala no tendrá precedentes.

El Open Images Challenge será único en estas áreas:

  • Hay 1,7 millones de imágenes de entrenamiento, incluidas 500 categorías y 12,2 millones de anotaciones de borde;
  • En comparación con los desafíos de detección anteriores, habrá una categoría más amplia, que incluirá nuevos objetos como "fedora", "muñeco de nieve", etc.
  • Además de la detección de objetos convencional, esta prueba también incluirá la detección de relaciones visuales al detectar pares de objetos, como "mujer tocando la guitarra".

El conjunto de datos de entrenamiento ya está disponible; un conjunto de prueba que contiene 100.000 imágenes se publicará en Kaggle el 1 de julio de 2018. La fecha límite para la presentación del Desafío es el 1 de septiembre de 2018.

Esperamos que el conjunto de capacitación más amplio estimule la investigación sobre modelos de detección más complejos que superen el rendimiento de la tecnología más avanzada actual; por otro lado, esperamos que las 500 categorías puedan evaluar diferentes sondas con mayor precisión. En qué áreas el dispositivo funciona mejor. Además, tener una gran cantidad de imágenes con múltiples anotaciones de objetos puede ayudarlo a explorar la detección de relaciones visuales. Este es un tema candente y tiene cada vez más subcomunidades.

Además de lo anterior, Open Images V4 también contiene 30,10 millones de imágenes verificadas manualmente para 19794 etiquetas de nivel de imagen de clase. Por supuesto, estas etiquetas no son parte del desafío, de los cuales 5,5 millones de etiquetas a nivel de imagen fueron generadas porcrowdsource.google.comde miles de usuarios en todo el mundo

Fuente

Related Posts