Un vídeo 360° muestra cómo las cámaras de un Tesla analizan una carretera de montaña

Por @Alvy — 28 de noviembre de 2018

Este vídeo de algo más de un cuarto de hora es un montaje inmersivo (se puede mover con el ratón porque es un vídeo 360°) de las imágenes de las 8 cámaras de vídeo de un Tesla haciendo un recorrido en modo ~~«piloto automático»~~ perdón, «piloto mejorado». Son parte de los 18 kilómetros de la llamada Cola del Dragón, un puerto de montaña que hay entre Carolina del Norte y Tennessee, famoso por sus 318 curvas. Algo así como Despeñaperros pero a lo bestia.

Importante: el coche no va en modo automático continuamente, porque en algunos momentos maniobra para permitir adelantamientos e incluso en momentos como 06:00 se detiene en el arcén unos instantes. [También hay ciertas dudas sobre cómo se han extraído las imágenes de las cámaras –se supone teóricamente imposible para el usuario corriente– e incluso de si el montaje podría ser un fake porque la calidad de las cámaras no es precisamente cristalina y tiene poco frame rate. Pero lo cierto es que no sería imposible poder extraerlas y luego montarlas como en el vídeo.] Por otro lado los datos de velocidad y de identificación de vehículos («cajas», IDs, carril por el que circulan, estado, velocidad…) parecen correctos. Todo esto es una mera muestra de la dificultad de que los coches inteligentes «conduzcan solos».

Según dice el autor del vídeo las imágenes se corresponden al AutoPilot 2.5 del Tesla. Tanto del software como del hardware de esos coches existen diversas versiones con diferentes características, incluyendo mayor redundancia para evitar problemas, procesadores dedicados… En el llamado Hardware 3.0 (que no sería el del vídeo, sino el más actualizado) los técnicos de Tesla han afirmado que cuenta con procesadores para procesar hasta 2.000 fotogramas por segundo.

A Structured Approach to Unsupervised Depth Learning from Monocular Videos

En otras noticias, A Structured Approach to Unsupervised Depth Learning from Monocular Videos en el blog de Google AI explica cómo están trabajando para obtener datos de profundidad a partir de imágenes monoculares –de una sola cámara– a partir de los movimientos de la cámara y las diferentes vistas de la escena.

(Vía Electrek.)