Por @Alvy — 9 de Septiembre de 2009

La «anonimización» de los datos personales que se utiliza a veces con bases de datos personales para diversas finalidades se enfrenta a algunos problemas estadísticos interesantes. Uno que me pareció especialmente impactante, y eso que data de un trabajo del 2000, es sobre lo fácil o difícil que es re-identificar a personas reales a partir de datos aparentemente neutrales y «anonimizados».

Una experta en ese campo demostró que el 87 por ciento de los ciudadanos estadounidenses pueden ser identificados de forma inequívoca mediante sólo tres datos: su código postal, su fecha de nacimiento y su sexo. Si lo piensas de otro modo, ¿cuántas personas en tu distrito postal puede haber nacido exactamente en la misma fecha que tú y ser también hombre o mujer como tú? Evidentemente esto puede variar de país en país según el tamaño de los códigos postales y la densidad de población, pero es un buen ejemplo.

El trabajo se llama Broken Promises of Privacy y consistió en comprobar los datos pretendidamente anónimos de pacientes de un hospital con los registros públicos del censo electoral, a los que cualquier persona puede tener acceso por unos pocos dólares. A partir de ahí la autora del trabajo consiguió ese 87 por ciento de aciertos a la hora de identificar inequívocamente los nombres reales de las personas de la base de datos original.

(Vía Slashdot y más sobre el tema en Ars Technica.)

Compartir en Flipboard  Compartir en Facebook  Tuitear

Microsiervos Selección


La criptografía

EUR 11,40 (Reseña en Microsiervos)

Comprar


Enigma

EUR 8,49 (Reseña en Microsiervos)

Comprar


Amazon Associates

Los productos aquí enlazados están a la venta en Amazon. Incluyen un código de Afiliado Amazon Associates que nos cede un pequeño porcentaje de las ventas. Los productos están seleccionados por los autores del blog, pero ni Amazon ni los editores de los libros o fabricantes de los productos participan en dicha selección.

Más libros y productos en:

Microsiervos Selección