Por @Alvy — 8 de Octubre de 2005

Deep Thoughts at Web 2.0 es un artículo sobre el contenido de una de las ponencias en la Conferencia Web 2.0 en las que participó la gente de Bloglines (ahora Ask Jeeves). Tienen un curioso estudio sobre los datos de su servicio, donde se aprecia un efecto ley de potencias y por extensión de larga cola en el uso de los feeds, aunque ellos se han concentrado en explicar lo que pasa en la cabeza del servicio en vez de en la larga cola.

En julio publicamos Which Feeds Matter? en el que nos preguntábamos cuáles era los feeds realmente importantes, siendo nuestra definición de «los feeds importantes» los que tenían al menos un suscriptor en Bloglines. La respuesta fue aproximaramente 1,1 millones de feeds, un número pequeño teniendo en cuenta que tal vez haya 18 millones de blogs por ahí (...) Como la gente nos pidió más datos sobre esto, hemos vuelto a analizar los datos para la conferencia y hemos puesto online una copia de la presentación [.ppt PowerPoint] para los interesados. Algunos de los detalles más destacados son que apenas sólo cuatro meses después los feeds con al menos un suscriptor han pasado de 1,1 millones a 1,3 millones. En la curva hay un bajón enorme cuando se ordenan por «suscriptores», en el punto situado a partir de 20 suscriptores. A los que superan esa cifra los llamamos «los feeds que realmente importan». Con más de 1.000 suscriptores sólo hay 437 feeds. A esos les hemos puesto un nombre científico para su nivel de importancia: Sweet Feeds (feeds deliciosos).
Es bastante impresionante el dato de que con más de 1.000 suscriptores sólo haya 437 feeds en el mundo (entre 18 teóricos millones al menos, probablemente muchos más). También en la presentación se dice que con más de 5.000 sólo hay 60 «Really Hot» (Realmente Calientes). El cabeza de la lista por cierto es Slashdot.org, el sitio más geek de toda la Internet, con más de 50.000 suscriptores (lástima que Barrapunto no ocupe la misma posición en español).

Sobre los feeds de sitios en español la verdad es que no indican nada, pero en CompareBlogs.com como hemos contado alguna vez hay bastante, extraída principalmente también de Bloglines. Al parecer sólo hay unos diez blogs en español con más de 1.000 suscriptores en bloglines, que son los que entrarían en esa lista de 437 feeds deliciosos, a los que habría que añadir algunos otras fuentes RSS de sitios como periódicos y otros webs informativos que no son blogs - en PubSub Top 1000 había una buena lista.

Ah! Otra ponencia realmente buena de la Web 2.0 ha sido Less as a competitive advantage de Jason de 37 Signals.

- Esta historia va dedicada a JJ, Fernand0, Víctor y todos los fans de la Ley de Potencias, la Larga Cola y todos esos conceptos, que seguro que disfrutarán con estos numeritos.

(Vía Ask Jeeves Blog.)

Compartir en Flipboard  Compartir en Facebook  Tuitear

27 comentarios

#1 — Elías

¡Mi blog tiene exactamente 20 suscriptores! ¿Importo realmente, o importo simplemente?

Saludos ^_^

#2 — Alvy

Corre, corre, busca algún amigo que se suscriba! ;-)

#3 — Egocentrico

Bueno... el mio tiene 19, contándome yo :-D

#4 — Víctor R. Ruiz

¡Gracias! :)

#5 — JJ

Se agradece la dedicatoria, pero nosotros somos los de la ley de potencias; el de la larga cola es Julio.

#6 — Alvy

Sí, lo cambié arriba pero no abajo, sorry. Lo arreglo. Pero vamos, al final una cosa y la otra como que siempre salen juntas, en realidad va dedicado a los fans de los numeritos y los estudios estos y sois los primeros de los que siempre me acuerdo... ;-)

Aquí lo que yo adivino es como que se ve la ley potencias claramente por suscriptores/feeds y lo de la cabeza típica de unos «muy pocos» comparados con el total, y lo increiblemente larga que es la larga cola y la cantidad de negocio larga-cola que se podría hacer (¿o se está haciendo ya?) con ella.

#7 — Andrea

Barrapunto no debe tener tantos suscriptores porque el feed que publican no tiene el texto completo del post, y a veces es muy molesto ir al sitio a leer la noticia...

#8 — Alvy

Sí, tiene sólo 2.500 suscriptores, que aun así no está mal... pero imagínate los que podría tener si fuera un buen feed, ¡rularía la feedesfera! ¡más que los periódicos podría tener! ;-) En fin, cada empresa dedice cómo hace las cosas, y BP no es ninguna excepción.

#9 — judas

Bueno, en realidad el estudio parece bastante reducido.
Quiero decir, según parece sól se tienen en cuenta las suscripciones mediante Bloglines. yo, por ejemplo, sigo muchos blogs mediante lector de feeds de escritorio y no los tengo agregados en Bloglines. Y supongo que como y habrá bastante gente.

#10 — RBA

Me parece bastante penoso que el sitio predominante en este sentido declare que vé menos de 450 blogs con 1000+ suscriptores.

Por supuesto se entiende que hay mucha gente que usa otros servicios o lectores, o incluso que lo consultan "manualmente", pero aún así.

#11 — Anonymous

Disculpen mi ignorancia, pero, ¿cómo saben eso?.

Yo pensaba que la suscripción no era más que decirle al programa de turno que vaya comprobando cambios en un fichero xml público que resume el contenido de una web.

De ahí no sé cómo se puede saber la cantidad de gente que usa un programita de estos para seguir tu sitio web. Ni si quiera es como decir la cantidad de gente que la ha visitado porque se supone que estos programas hacen comprobaciones con mucha regularidad con lo que no puedes contar cada comprobación como un nuevo usuario que se ha suscrito.

#12 — Alvy

Respecto a #9 y #10 simplemente comentar que aunque es cierto que NO todo el mundo utiliza bloglines, es sin duda el sitio más representativo (o con más cuota de mercado) al respecto, no recuerdo exactamente cuánto ahora, pero bastante más que cualquier otro. Seguramente tiene ×5 ó ×10 veces más que muchos agregadores/aplicación-local que mucha gente usa.

Esto quiere decir que de cara a hacer un «estudio de uso de suscripciones» es bastante significativo, y desde luego más que cualquier otro que pudiera usarse para lo mismo. Si el estudio lo hiciera, no sé, NetNewsWire que tiene muy poca couta (5%) y además está sesgado por ser sólo para Mac OS X, etc. pues diría que es un problema, pero si lo hace «el más gordo de la clase» (con permiso de Google Reader por ahora) yo diría que son datos muy representativos.

Por entenderlo, es como si Google hace un estudio y dice: «las palabras más buscadas por los internautas son tal y tal y tal». Bueno, Google no es el 100% del mercado de buscadores, pero es tan grande que eso que dice probablemente es verdad y extrapolable a otros buscadores.

Por otro lado a #11 comentarle que en Bloglines hay gente que tiene su perfil público y se pueden ver todas sus suscripciones, y que además de eso el servicio ofrece la «cifra de suscriptores totales a cada feed» (se ve junto al título del feed, creo). Ellos saben el total porque saben cuales son las suscripciones de cada persona. (Así es como extrae sus datos CompareBlogs.com y otros servicios de estadísticas y ránkings.

pd: encontré esta lista que indica un poco el marketshare de cada agregador, tampoco es perfecta pero bueno, es indicativo si Bloglines tiene casi un tercio del mercado: RSS RSS Market Share. Sobre todo, insisto, de cara a un estudio tan «genérico» como este.

Aggregator Name (Market Share Percentage)

1. Bloglines (32.86%)

2. NetNewsWire (16.95%)

3. Firefox Live Bookmarks (7.78%)

4. Pluck (7.20%)

5. NewsGator Online(4.45%)

6. (not identified) (4.07%)*

7. FeedDemon (3.83%)

8. SharpReader (3.27%)

9. My Yahoo (2.58%)

10. iPodder (2.42%)

11. NewsGator (2.23%)

12. Thunderbird (2.13%)

13. RSS Bandit (1.12%)

14. NewsFire (1.05%)

15. iPodderX (1.02%)

16. Sage (0.71%)

17. FeedReader (0.67%)

18. RssReader (0.54%)

19. LiveJournal (0.46%)

20. Opera RSS Reader (0.45%)

#13 — JJ

Solo una aclaración: no todas las leyes de potencias incluyen una cola larga; o mejor dicho, no todas las incluyen en el sentido que se le da habitualmente. Para que los "menos" en conjunto, sean más que los "más", hace falta que el exponente de la ley de potencias sea pequeñito.

#14 — judas

Alvy.

Si no te digo que no, pero por ejemplo el programa que yo uso ni aparece en la lista... y tengo más de 200 suscripciones, que ya no se cuentan.

#15 — lonoak

Según mi cuenta de bloglines, ahora mismito:

- Google Dirson: 1458 (!)
- Barrapunto: 475
- Microsiervos: 664
- Atalaya de JJ: 566
- fernand0: 445
- Linotipo de Victor: 221 (+87+9)
- Cuaderno de bitacora en Blogalia: 169 (+97)
- Escolar.net: 796
- Tintachina (extinta...): 740
- Elastico: 467
- Alzado: 663

Curioso lo de Dirson...

En el caso de Victor, he comprobado que hay distintas subscripciones con distinto número de subscriptores (¿formatos del feed?). Ello podría aumentar también el número de subscriptores de otros sitios (no lo he comprobado).

#16 — Alvy

#14, Judas, es que en los estudios/estadísticas como estas lo que pasas tú, individualmente, no eres nada significantivo (ni yo tampoco, ni JJ ni nadie individualmente). Es lo global lo que cuenta, lo que hace la mayoría. Realmente sí, hay un montón de agregadores o pseudoagregadores nada representativos en el inframundo por debajo del 1% de cuota de mercado, es decir que no los usa apenas nadie o para el caso es como si no existieran, vamos. (Muchos incluso son lectores programados por los propios usuarios para aprender xml/rss etc).

#17 — Alvy

#15 – Para hacer ese cálculo en bloglines ya hemos explicado alguna vez tienes que sumar en cada blog los diversos feeds que ofrece. Por ejemplo Microsiervos se ofrece en sabores: 1.0, 2.0, Atom, el viejo feed de blogger RSS 0.9 creo, etc. Es decir que salen en total muchos más que esos. (Y luego sucede que algunos blogs como el nuestro tienen también feeds para comentarios, por categorías, etc). A todos los blogs les pasa lo mismo más o menos, al menos casi todos ofrecen RSS y Atom. En CompareBlogs.com hicieron ese cálculo teniendo en cuenta esos detalles creo.

#18 — Luistxo

En el futuro, todo el mundo tendrá derecho a disfrutar de 15 suscriptores. Ese será nuestro lugar en la larga cola.

#19 — Alvy

Esto me recuerda por cierto las métricas de Feedblitz al poco de lanzarse (servicio de envío de RSS por email):

Feedblitz: A Few Metrics

* The vast majority of feeds serve an audience of 50 or fewer, but...
* 23 feeds have 100 or more subscribers.
* The two largest feeds have ~1,000 subscribers each.
* Feed languages used include Hebrew, Spanish, Swedish, German, French, Japanese and Chinese.

#20 — Fernando Plaza

Efectivamente Alvy, en CompareBlogs se acumulan dentro de cada blog todos sus feeds y se buscan el número de suscriptores tanto en Bloglines como en Feedness.

Pulsando sobre [+] se desglosan todas las cantidades por Feeds, asi por ejemplo Microsiervos consta que tiene 17 feeds en CompareBlogs y 3.146 suscriptores totales:

Feed B 928 + 478 F
Feed B 668 + 154 F
Feed B 321 + 83 F
Feed B 135 + 54 F
Feed B 101 + 5 F
Feed B 51 + 0 F
Feed B 28 + 7 F
Feed B 26 + 1 F
Feed B 14 + 0 F
Feed B 14 + 0 F
Feed B 13 + 0 F
Feed B 13 + 0 F
Feed B 12 + 0 F
Feed B 11 + 3 F
Feed B 11 + 0 F
Feed B 10 + 0 F
Feed B 5 + 0 F

Total (B) Bloglines 2361
Total (F) Feedness 785

Por como funciona su buscador no creo que Bloglines tenga forma de agrupar distintos feeds como parte de un mismo Blog... lo cual creo que es un deficit importante... al fin y al cabo lo que importa son los suscriptores totales del blog no de cada uno de sus feeds... no?

No obstante, ahora que más blogs de EEUU se están dando de alta en CompareBlogs creo que deberíamos reflexionar si no tenemos demasiados feeds (¿?) los blogs en español... en EEUU la mayoría de los blogs, incluso los más importantes solo tienen un feed.

#21 — Alvy

Sí, lo de tantas versiones es una herencia de las guerras RSS vs Atom, hoy en día con tener un tipo RSS 2.0 o Atom la verdad es que basta (ya unificaremos y redirigiremos los viejos).

En realidad en Microsiervos tenemos 29 feeds distintos, a saber: 25 porque hay uno por cada categoría + 1 feed RSS 2.0 completo + 1 feed RSS 2.0 breve (titulares) + 1 feed RSS 1.0 + 1 feed Atom + 1 feed de los últimos comentarios + 1 viejo feed RSS de blogger (http://www.microsiervos.com/blogger_rss.xml).

#22 — Antonio

Creo que decir que sólo 437 feeds son importantes del millón y tantos de blogs sólo porque rebasan los mil subscriptores en un servicio que representa el 30 y tantos % del total de feeds es poco representativo.

Esos 437 feeds son los más importantes SOLO para los que usan bloglines como lector de feeds. Punto.

#23 — Alvy

Bueno, idealmente deberían sumarse datos de varios servicios, pero a falta de ese dato el servicio que ya ocupa el 30% es sin duda el más representativo, sobre todo teniendo en cuenta que el siguiente es sólo 15%. Si me lo dijeras de uno que tiene solo el 5%, vale, pero de uno del 30%... yo creo que sí que es válido (no perfecto, pero válido).

#24 — Antonio

"idealmente deberían sumarse datos de varios servicios, pero a falta de ese dato..."

Obvio que te faltan datos...

Pon atención a esta argumentación:

Esos 437 feeds son representativos para usuarios que usan Blogines sólamente, entiende eso. No sólo existen los lectores de feeds para leer blogs. ¿Y los bookmarks en exploradores? ¿Y los vínculos? ¿y los otros lectores de feeds? Es claro que no se pueden estudiar las poblaciones totales, y para ello se hicieron las muestras. Y debes tomar una muestra de la POBLACION TOTAL, y no pretender representar un dato por el 30% de sólo un sector de la población... Piensa: Bloglines es el 30% de los que usan lectores de feeds. Imagina qué porcentaje será de TODAS las formas para leer blogs: te aseguro que es menos de 10%. ¿Es representativo?

Para sacar un dato correcto, debes hacer una muestra de TODA la población: lectores de feeds + vínculos directos + favoritos/bookmarks + enlaces en sitios web.

Te pongo un ejemplo simple:

Supongamos que quiero sacar qué disco se vendió más en el 2004. Ah, pero como no hay datos precisos de toda la población (piratería, tiendas pequeñas, supermercados, tiendas departamentales, ventas por Internet), sólo voy a ver las tiendas departamentales. Ah, pero 'Tiendas Juanito' tiene el 30% del marketshare de todas las tiendas departamentales, y ahí veo que el disco más vendido es el de 'María'.

Así es la manera en como analizaste ese dato de Bloglines.

¿Es esto representativo en la población? ¡Claro que no! El disco de 'María' es el más vendido sólo en 'Tiendas Juanito'.

NO es representativa la manera en que lo analizas, por lo tanto NO es válida tu conclusión.

---

Espero que con este argumento comprendas mejor lo que intentaste decir...

...Si invertí tiempo en tratar de explicarte, es porque considero que tu sitio es muy visitado, y es una importante fuente de noticias, y por ende, debes cuidar lo que dices. Sobretodo si aseguras (como si nada) conclusiones personales imprecisas y difusas. Recuerda que tienes una responsabilidad con tus lectores...

...Ahora que también puedo estar escribiéndole a un necio que se cree sabelotodo, y si es el caso, mejor dejo de perder mi tiempo. No sabré de tecnología como tú, pero estadística sí sé.

Gracias por leer este comentario.

#25 — Alvy

Ninguna estadística utiliza toda la población para obtener datos, porque en tal caso la muestra sería igual de grande que la población. Se hace con los recursos que se tienen o con lo que se puede. En este caso se usa algo bastante grande y significativo. Como no tienes otros datos, no puedes usarlos. Bueno, de hecho el que ha hecho el estudio lo ha hecho con todos los datos que tiene en su empresa que es Bloglines, sería genial si otros propietarios de agregadores hicieran lo mismo.

En el caso que dices sin tiendas juanito vende el 30% de los discos de un país y dice que la artista María es el más vendido, ese dato puede llegar a ser bastante representativo a falta de algo mejor, y si me dicen que María es la artista más popular en cierto país me lo creeré porque es más probable que eso sea verdad porque al menos ese estudio tiene cierta base. Puede estar mal, pero es un comienzo.

...

Por cierto que aquí en este web somos unos irreponsables y que no puedes fiarte de nada que digamos.

Recuerda que la objetividad está obsoleta.

No tenemos ninguna responsabilidad sobre lo que decimos, y menos «con los lectores», por lo menos yo no la siento internamente ni me quita el sueño, vaya. Escribimos aquí para divertirnos un rato y punto.

#26 — Antonio

"Ninguna estadística utiliza toda la población para obtener datos"

Por supuesto, por eso se toma una muestra de toda la población (todos los medios para leer blogs), no sólo de un sector de ella (Bloglines). ¿Qué parte no entendiste?

Y tienes razón, faltan datos, faltan datos... por lo que no puedes tomar el estudio de Bloglines como el verdadero y universal sólo por ser 'el único' y a falta de otros datos. Pregunta a mil, diez mil, un millón personas de distintos sectores de la población qué medio usan para leer blogs, y los que dirán 'Bloglines' (como te dije), no rebasarán un 10%.

Tampoco entendiste mi ejemplo: En él, Tiendas Juanito es el 30% del marketshare sólo de las Tiendas Departamentales, pero si tomamos en cuenta todos los medios para vender discos, tal vez llegue a un 10 o 15%.

---

Veo que tomaste a mal mi comentario de "tienes una responsabilidad con tus lectores"...

Lo pongo de esta forma: si empiezas a sacar conclusiones como éstas y las expones como verdad (cuando no lo son), tu "escritos para divertirte un rato" pierden credibilidad. Sin credibilidad, no tiene caso leer.

Es bueno darse cuenta.

La objetividad no es obsoleta, es para usarse con juicio, madurez, un amplia perspectiva, y responsabilidad. La subjetividad cualquiera la maneja. Te has puesto la soga al cuello al decir "no puedes fiarte de nada que digamos".

Hasta luego.

#27 — Alvy

Aha. Bueno, está claro que lo vemos un poco de formas diferentes.