Por @Alvy — 11 de Abril de 2021

European Web Archive

Me encontré con el European Web Archive (Archivo Web Europeo) que aunque tiene pinta de ser algo «oficial» por el uso del look de la Unión Europea, banderita y color azul Pantone Reflex Blue típicos, es una iniciativa privada. Es una especie de Archive.org espartano, gestionado desde Europa, más concretamente desde la República Checa. Contiene copias históricas de páginas web de todo el mundo, pero no imágenes ni vídeos. Tiene 348 millones de sitios web guardados a día de hoy.

El Archivo Web Europeo es un servicio gratuito que permite acceder a versiones históricas de sitios web. Su misión es ofrecer un archivo de sitios web a largo plazo a los ciudadanos de la UE y de otros países. Está gestionado por Intelligence X, un motor de búsqueda y archivo de datos. No estamos financiados por la UE. Tendría sentido que la Comisión Europea abriera el camino a un proyecto de archivo de Internet financiado y gestionado por la UE.

En Archive.eu Puedes buscar cualquier dominio y comprobar si lo tiene ya archivado. Las pruebas que he hecho son cuando menos irregulares: la versión de Microsiervos que guarda es de mayo del año pasado, la del Museo del Prado, de enero de 2021 y la Wikipedia en español ni siquiera aparece (!?).

No sé si será porque el proyecto no está terminado, sigue en pruebas, rastreando, por falta de medios o porque funciona regular. En fin, es de esos proyectos que por su parecido con otros similares, como Archive.org, uno se pregunta si no sería mejor que en vez de duplicar esfuerzos los aunaran.

Compartir en Flipboard Compartir en Facebook Tuitear

PUBLICIDAD



Por @Wicho — 6 de Abril de 2021

Llevo un tiempo siguiendo con curiosidad el asunto de los NFT. Pero desde la subasta por el equivalente a unos 65 millones de euros de Todos los días: los primeros 5.000 días de Beeple lo sigo más bien con una mezcla de fascinación y terror. Un poco como cuando ves que va a ocurrir un accidente pero no puedes dejar de mirar. Y es que creo que alguien va a acabar haciéndose daño. Aunque al mismo tiempo creo que los NFT bien usados tienen un enorme potencial para que las personas que crean obras de cualquier tipo puedan ganar dinero con ello. Eso sí, como digo siempre, cuando Apple sacó el iPod original crfeí que se habían equivocado de cabo a rabo e iban a terminar con la empresa. Así que no me hagáis mucho caso. O sí. Caveat emptor y tal. Aunque yo no os quiera vender nada.

Empecemos por el principio: ¿qué es un NFT? Viene de las siglas en inglés de token no fungible. Que para entendernos es como una especie de certificado digital de originalidad que se puede asociar a cualquier ítem digital. No tiene por qué ser una imagen, que es lo que más se ve últimamente. Puede ser un vídeo, música, un texto… en general cualquier cosa que esté en formato digital; incluso puede ser una foto o un escaneo de una obra que ha sido creada en el MundoReal™. Está basado en tecnología blockchain, por lo general en la de Ethereum, aunque hay otras opciones más minoritarias. Pero a diferencia de las criptomonedas cada NFT es único, de ahí que pueda servir como prueba de autenticidad. Es como si en el MundoReal™ tienes un Banksy que además de firmado por él va acompañado por un certificado de Pest Control que lo autentifica. Un NFT tiene además la ventaja de permite seguir su historial de transacciones asociado ya que estas quedan guardadas automáticamente.

Creo que es muy importante tener muy claro que los NFT, por limitaciones técnicas, normalmente no pueden contener las obras digitales que certifican. Así que lo que hacen es una ñapa: contienen un enlace a una copia de esa obra que está en algún servidor accesible a través de Internet. Lo cuenta Anil Dash, uno de los creadores de los NFT en NFTs Weren’t Supposed to End Like This.

NFTs que desaparecen

Los NFT apuntan a una copia que está disponible en Internet… o que debería estarlo. Porque… ¿qué pasa si ese servidor se cae? ¿O si la empresa a la que has comprado el NFT desaparece y con ella toda su presencia en línea? Aunque para esto se tiende a usar el IFS (Interplanetary File System), que se supone funciona aunque no haya un servidor concreto, como en las redes P2P. También hay un cierto lío de formatos a la hora de almacenar y representar los NFT que puede hacer que no se vean en según qué cartera electrónica.

Y también puede suceder que la copia de la obra a la que apunta el NFT sea borrada porque quien la ha subido no tenía los derechos; es algo que ya está pasando. Aunque es un poco del género bobo vender un NFT sobre el que no tienes derechos porque al estar basado en blockchain tirando hacia atrás se pueden seguir todas las transacciones asociadas. Claro que es de poco consuelo para quien lo hay comprado, que necesariamente va a tener fácil recuperar su dinero, ya sea virtual o «de verdad».

En ¿Qué adquiero cuando compro un NFT? hay una explicación muy detallada de los aspectos de propiedad intelectual que rodean todo esto.

«Originales» en un mundo perfectamente copiable

Dicho todo esto mi primer problema con los NFT, o al menos con los precios que están alcanzando algunos de ellos asociados a determinadas obras, es si me aporta algo como admirador de la obra de alguien tener una copia de una de sus obras asociada a uno de ellos. Y más cuando, por definición, las obras en soporte digital son infinitamente copiables sin pérdida de calidad. Es más, ¿quién me asegura que no se van a producir millones y millones de NFT con la misma obra que yo he pagado si el contrato de compra no lo dice específicamente? A fin de cuentas son mucho más sencillos de producir que una edición limitada de grabados, por ejemplo. Salvo el coste ecológico de producirlos, claro. Más sobre esto más abajo.

Y por mucho que me puedan asegurar que no se va a hacer ningún NFT más basado en una obra determinada es imposible saber si alguien ha hecho una captura de pantalla –o se ha bajado el archivo que se mostraba en línea– mientras estaba a la venta o en subasta. Que igual no tiene la misma resolución que el original pero igual tampoco importa tanto. O en absoluto. En el caso de la obra de Beeple, por ejemplo, el «original» NFTeado es un jpeg de 21.069×21.069 pixeles. Pero es fácil encontrar copias por ahí. De hecho en la misma web de Christie's, que fue dónde se subastó, hay una copia a algo más de 6.000×6.000 pixeles que para ver en la inmensa mayoría de dispositivos digitales es más que suficiente. En fin que por 65 millones de euros que, en cualquier caso no tengo, tengo muy claro que no hay NFT que valga.

NFT de la imagen de una columna de Kevin Rose – New York Times
Un NFT de esta imagen de una columna de Kevin Rose en el New York Times se vendió por 560.000 dólares

Sin embargo, creo que a precios razonables podrían ser una forma de mostrarle mi reconocimiento y darle mi apoyo a aquellas personas que crean obras que me gustan. Pueden ser también una forma relativamente sencilla de que estas personas cobren por creaciones suyas que se vendan, por ejemplo, dentro de un juego –skins, accesorios, etc–, o incluso que estén expuestas en un museo digital. Otra cosa será convencer a alguien de que entre en ese museo cuando lo más seguro es que pueda encontrar copias de esa obra en mil sitios más sin tener que pagar por ellas. Aunque yo siempre he sido de pagar; creo que los creadores tienen todo el derecho de intentar vivir de su obra. Pero también es cierto que hay formas de cobrar que no tienen el coste ecológico de los NFT: una tarjeta de crédito, PayPal, Patreon, etc, por citar algunos ejemplos.

Los NFT, además, pueden llevar asociados cláusulas que aseguren que en una primera venta cobre todo –o todo menos las correspondientes comisiones la persona que lo haya creado– y que en ventas sucesivas cobren un porcentaje determinado de cada una de esas transacciones.

NFT de Overly Attached Girlfriend
Un NFT de Overly Attached Girlfriend se vendió por casi 420.000 dólares

Otros riesgos

Otra cosa es la volatilidad asociada al valor de las criptomonedas y que las personas que hayan creado la obra original vean como buena parte de lo que han ganado se esfuma. O no, pero no deja de ser un riesgo añadido si no convierten pronto ese criptodinero en dinero «de verdad» o en bienes. No es que sea dinero del Monopoly, como he visto afirmar en algunos sitios, porque, al menos hoy por hoy, te lo cambian sin mayor problema. Pero es un riesgo añadido.

Los NFT, como decía antes, llevan además asociado un coste ecológico nada despreciable relacionado con el enorme consumo de electricidad y recursos necesario para generar los NFT propiamente dichos y para, más tarde, gestionar su compra y venta, ya sea directa o mediante subasta, así como posibles subastas posteriores.

En fin, que estoy seguro de que se me escapan mil cosas y matices, pero me parece que la burbuja que se está formando alrededor de los NFT tiene que estallar más bien pronto que tarde. Al estilo de la de los tulipanes en los Países Bajos en el siglo XVII, como adelantaba Alvy hace unos días. Y que sólo los que hayan especulado al principio –dudo que se pueda calificar de otra forma lo que está pasando– serán las únicas personas beneficiadas. ¿Un pixel rojo por 900.000 dólares? ¡Amos, anda!

Os dejo con unos cuantos enlaces sobre el tema que he ido recopilando además de los que ya he usado en el texto:

Compartir en Flipboard Compartir en Facebook Tuitear

PUBLICIDAD



Por @Alvy — 3 de Abril de 2021

Blog – Common Crawl

El nombre de Common Crawl es a la vez un proyecto y una organización sin ánimo de lucro que desde 2011 se dedica a rastrear la World Wide Web y generar un archivo abierto y accesible para que cualquier persona o empresa pueda acceder a una copia completa cómodamente y sin tener que pagar nada… algo así como lo mismo que tienen Google, Bing y el resto de buscadores, pero en versión de los comunes de los mortales. Según cuentan en su blog la última versión ocupa 280 terabytes y contiene 2.700 millones de páginas. Buenas cifras; inmensas pero no inabarcables.

Entre los proyectos ya llevados a cabo con estos datos están:

  • Análisis de popularidad de dominios
  • Extracción de ofertas de empleo
  • Pruebas de categorización
  • Análisis sobre la publicidad en internet
  • Búsqueda de tags
  • Reconocimiento de sitios que publican feeds RSS
  • Análisis del impacto de noticias en los mercados
  • … y decenas de otros

El proyecto técnicamente utiliza un bot llamado CCBot que está basado en Nutch, de Apache. Se comporta como cualquier otro bot y cualquier webmaster pueden utilizar el protocolo robots.txt de exclusión de robots, si quiere evitar que indexe sus páginas o que lo haga más despacio (ver FAQ). El rastreo es automático y se realiza periódicamente, según parece al menos una vez al mes. Aunque no lo he visto específicamente indicado da la impresión de que sólo extrae el texto de las páginas, no las imágenes ni vídeos, que sin duda ocuparían mucho más.

Por que he cotilleado por ahí el número promedio de hiperenlaces por página web debe estar alrededor de los 35 enlaces, de modo que esto significa que en el último rastreo debía haber en la WWW alrededor de 100.000 millones de enlaces en toda la Web que han podido rastrear. Bonita cifra.

Relacionado:

Compartir en Flipboard Compartir en Facebook Tuitear

PUBLICIDAD



Por @Alvy — 26 de Marzo de 2021

Archivo vacío 8 GBBruab Schrader publicó en su blog un curioso truco de baja tecnología que me pareció especialmente interesante por lo anti-intuitivo que resulta. Lo ha titulado simplemente Why All My Servers Have an 8GB Empty File y sirve para evitar uno de los problemas más típicos de muchos servidores, el temido «disco lleno».

El caso es que cabría preguntarse por qué alguien querría guardar un fichero gigantesco en su servidor para evitar problemas de «disco lleno» si al hacerlo precisamente se llena un poco más el disco. Tal y como explica Schrader el caso es que en muchas máquinas Linux y de otro tipo cuando se llenan suele ser algo tanto difícil de detectar como de recuperar rápidamente. ¿Puedes ampliar el disco en cuestión de minutos? Normalmente, no. ¿Qué borras cuando el disco está lleno? Lo que no sirva. ¿Estás seguro de que eso que pretendes borrar no sirve? Mmm…

El truco es que si cuando tienes el disco con una ocupación adecuada, digamos 30 de 100 GB, añades un «fichero falso» o «fantasma» de 8 GB [el tamaño puede variar] si llega el temido momento del fallo por «disco lleno» simplemente borras ese fichero y mágicamente tendrás a tu disposición un montón de GB libres. Y es entonces cuando ganas tiempo para buscar otra solución más adecuada y ponerla en marcha, ya sea borrar otras cosas, ampliar el espacio en disco, etcétera.

Una forma simple de crear el fichero en cuestión es ejecutando:

head -c 8000000000 /dev/urandom > random_file.txt

o bien (es más rápido, pero sólo admite hasta 2,1 GB)

dd if=/dev/zero of=random_file.txt bs=2000000000 count=1

o si se utiliza Mac OS X:

mkfile 8g random_file.txt

(donde el número indica cuántos bytes tendrá el fichero fantasma en cuestión). En el primer caso el contenido es aleatorio –y por tanto no se puede comprimir– y según se configure la copia de seguridad también ocupará espacio allí, por lo que tal vez sea mejor eximirlo de la copia. Las otras variantes quedan simplemente llenas de ceros y en las copias comprimidas ocupan mucho menos.

Lo del «disco lleno» lo hemos vivido más de una vez en el servidor en el que alojamos el blog, donde aparecía creando caos y confusión de forma impredecible porque los logs crecían sin control, o había demasiadas copias de seguridad mal gestionadas, algo que ya solucionamos hace tiempo. (Ayuda mucho recibir un mini-informe semanal por correo). En algunos momentos tras entender cuál era el problema tuvimos que «borrar cosas» cruzando los dedos para no perder más tiempo y volver a tenerlo funcionado lo antes posible, y hubiera estado bien tener esta especie de «solución salvavidas» al alcance de un borrado rápido de un fichero concreto.

Según cómo se mire, el truco puede compararse con llevar piedras en una mochila cuando te persigue un león: si las arrojas al suelo, corres más rápido y escapas más fácilmente… pero podrías no llevarlas desde un principio y quizá así no te perseguiría el león (!) En fin, quizá sea por eso por lo que algunos atletas entrenan con piedras, para anticiparse a un «escenario peor».

Compartir en Flipboard Compartir en Facebook Tuitear

PUBLICIDAD