Por @Alvy — 27 de Febrero de 2017

YOLO (You Only Look Once, «sólo se mira una vez») es un algoritmo de visión artificial que detecta y clasifica objetos en tiempo real. Lo hace tan rápido que una tarjeta gráfica Nvidia Titan X es capaz de procesar entre 40 y 90 fotogramas por segundo, muchos más que los 30 fps con los que solemos visualizar las películas. Además esa identificación la hace con una precisión de entre el 40 y el 80% de certeza, según el tipo de pruebas a las que se le someta.

El vídeo es básicamente una demostración de poderío y en esta otra charla puede verse a Joseph Redmon, uno de sus creadores, explicando cómo funciona y cómo ha sido la evolución en los últimos años, en los que hubo que innovar mucho respecto a cómo se realizaba ese procesamiento de imágenes y detección:

Este tipo de algoritmo solían necesitar entre 15 y 20 segundos para procesar e identificar los objetos presentes en cada imagen, algo que volvía totalmente incapaces de procesar vídeo en tiempo real a los ordenadores hace unos años. Con el tiempo se pasó a necesitar tan solo 22 milisegundos por imagen, lo que permite obtener los mismos resultados, tanto o más precisos, en vídeos en movimiento.

YOLO está escrito en código abierto y puede descargarse en Github.

Compartir en Flipboard  Compartir en Facebook  Tuitear

Microsiervos Selección


Smart Cities: Big Data, Civic Hackers, and the Quest for a New Utopia

EUR 9,49

Comprar


Programmed inequality

EUR 14,80 (Reseña en Microsiervos)

Comprar


Amazon Associates

Los productos aquí enlazados están a la venta en Amazon. Incluyen un código de Afiliado Amazon Associates que nos cede un pequeño porcentaje de las ventas. Los productos están seleccionados por los autores del blog, pero ni Amazon ni los editores de los libros o fabricantes de los productos participan en dicha selección.

Más libros y productos en:

Microsiervos Selección