Por @Alvy — 10 de Junio de 2019

Este sistema llamado SpotGarbage es capaz de reconocer las bolsas de basura que hay en el suelo de las calles de la ciudad. Lo cual no puede negarse que es algo especilamente práctico en muchas ciudades actuales: puede ayudar a los servicios de recogidas de basuras (por ejemplo avisando cuando hay muchas o cuando estén en sitios inusuales) o ayudar a analizar qué zonas necesitan que el camión pase más a menudo por ellas.

(A todo esto: si existe es porque hay ciudades, Nueva York sin ir más lejos, donde todavía lo normal es dejar las bolsas en mitad de la calle, no en cubos específicos. En el caso de Nueva York oí que irónicamente para ser uno de los lugares «con más ricos del mundo» las ratas estén tomando la ciudad. Hay concursos de fotos con ratas y a ver quién encuentra la rata más rolliza. Hasta hay documentales de vigilantes que recorren las calles con perros para cazar las ratas de desmesurado tamaño que pululan por ahí).

Volviendo a la app, parece que proviene de un concurso de ideas de Microsoft en la India. Es capaz de reconocer correctamente el 88% de las bolsas que hay tiradas en la calle tras un periodo de entrenamiento (funciona mediante aprendizaje automático). En la documentación hay más detalles: SpotGarbage: smartphone app to detect garbage using deep learning.

Compartir en Flipboard  Compartir en Facebook  Tuitear
Por @Alvy — 10 de Junio de 2019

En este vídeo de Ohad Frid publicado para el SigGraph 2019 que se celebra este verano se explica cómo editar lo que dice un busto parlante. Básicamente se utiliza el texto de la transcripción de lo que está diciendo la persona para localizar los puntos de corte. En esos puntos se puede modificar lo que dice, simplemente cambiando el texto.

El fluir del vídeo, el audio y el movimiento de los labios se mantiene de forma completamente transparente aplicando diversas técnica que incluyen el análisis de los fonemas, visemas, la pose 3D del rostro y otras técnicas de optimización.

El resultado es que la escena regenerada se regraba luego como un vídeo fotorrealista, de modo que apenas se nota que un texto ha cambiado por otro, haciendo «prácticamente invisible» el hecho de que se hayan eliminado o añadido palabras, o cambiado unas por otras (un dato que esté mal, como «91.4» por «82.2», por ejemplo) sin mayores problemas. En el vídeo hay varios ejemplos y una detallada explicación de las técnicas.

Es interesante que parte del trabajo incluya las consideraciones éticas de este tipo de técnicas. Que igual que vienen bien para corregir errores, mejorar los doblajes o adaptar un vídeo a diferentes grupos de edad (adultos o niños, por ejemplo) también puede tener un lado oscuro.

Entre las técnicas propuestas para «distinguir realidad de manipulación malintencionada» están sugerencias como indicar de forma clara y meridiana que las imágenes están modificadas (quizá como en la restauración de obras artísticas antiguas), incluir marcas de agua invisibles o la obligación legal de obtener permiso antes de hacer una modificación.

Relacionado:

Compartir en Flipboard  Compartir en Facebook  Tuitear
Por @Alvy — 8 de Junio de 2019

Google ha anunciado a su comunidad de desarrolladores Google Research Football, un entorno para practicar con diversas técnicas de inteligencia artificial y aprendizaje automático, en especial con el aprendizaje por refuerzo (RL).

El entorno consiste en un simulador de fútbol estilo FIFA con todas sus reglas: goles, faltas, fueras de juego, penaltis, etcétera. Se programan los agentes de los dos equipos y ¡a jugar! Con un buen ordenador se pueden conseguir unos 25 millones de «pasos» diarios de los jugadores en la simulación; eso son muchos partidos. Con una herramienta llamada Football Academy se pueden entrenar los agentes para cierto tipo de jugadas especiales: contraataques, pases, etcétera y ver cómo se comportan.

En el fondo es como cualquier otro juego en el que hay que desarrollar una estrategia que supere la estrategia del adversario, pero en la que se pueden ejecutar millones y millones de simulaciones cada día, al igual que han hecho con otros juegos como el ajedrez o el Go. Cada uno de ellos tiene unas reglas y unos entornos particulares –el del fútbol mucho más abierto y propenso a bugs, de hecho– y será divertido ver qué sale de esto.

El código puede descargarse del repositorio de Github:

Bonus: para el figura que ha elegido los nombres de los jugadores (Arquimedinho, Goodall, Euler…) y los equipos (Real Bayesians, Frequentists United…)

Relacionado con el aprendizaje por refuerzo:

Compartir en Flipboard  Compartir en Facebook  Tuitear
Por @Alvy — 5 de Junio de 2019

¡Por fin un avance en inteligencia artificial relevante para el mundo entero! En este anuncio de Domino’s Pizza explican cómo en algunos de los restaurantes de la cadena australiana emplean un sistema de visión artificial y reconocimiento de pepperonis (entre otros ingredientes) para asegurarse de que las pizzas llevan los ingredientes correctos y tienen el aspecto adecuado.

El chisme se llama DOM pizza checker y lo califican de «escáner inteligente». Tiene el aspecto de un proyector (humanizado con unos ledes y una sonrisa) y toma fotos/vídeo de la mesa en la que están las pizzas.

Lo que se comprueban son que el tipo de pizza sea correcto, los ingredientes sean los que han pedido los clientes e incluso la adecuada distrubición en toda la superficie circular de la pizza. Desde la invención de la pizza aleatoria no se había visto tamaño avance.

Compartir en Flipboard  Compartir en Facebook  Tuitear