Por @Alvy — 18 de Marzo de 2005

Amazon no deja de sorprender: ahora está analizando los textos de su enorme catálogo de libros y junto al título muestra las denominadas SIPs: Statistically Improbable Phrases (Frases Estadísticamente Improbables).

Por ejemplo para Cluetrain Manifesto muestra networked markets y market conversation; para Gödel, Escher, Bach chunked description y subjunctive instant replay; para Don Quixote, hundred ducados y errant chivalry; para Cosmos, microbiology experiments e interstellar spaceflight.

Parece que aciertan con frases que son muy destacadas en un libro respecto a cuánto se usan en otros libros. Así lo explican en sus páginas: Statistically Improbable Phrases:

Amazon.com's Statistically Improbable Phrases, or «SIPs», show you the interesting, distinctive, or unlikely phrases that occur in the text of books in Search Inside the Book. Our computers scan the text of all books in the Search Inside program. If they find a phrase that occurs a large number of times in a particular book relative to how many times it occurs across all Search Inside books, that phrase is a SIP in that book.
La de cosas que se pueden inventar cuando tienes el texto completo de todos los libros guardado en tus servidores.

(Vía Joho the Blog.)

Compartir en Flipboard  Compartir en Facebook  Tuitear

4 comentarios

#1 — marc

pues si tienen todos los textos a ver cuando inventan un programilla que haga un CRM sobre los usuarios y escriba la novela definitiva para cada uno guiandose por todo lo que compras en su tienda...

espero que no llegue ese dia

#2 — Pau Garcia i Quiles

Si Ana Rosa Quintana hubiera tenido acceso a las herramientas de Amazon.com, nunca habría tenido esos "problemas informáticos" que "desgraciadamente" hicieron que "se trasladaran" 100 páginas de otro libro "involuntariamente" :-D

#3 — Epaminondas Pantulis

Qué raro que no hayan extraído "billions and billions" del Cosmos de Carl Sagan :-P

#4 — Nacho

ahora descubrirán profecías escritas dentro de los libros! ;)))