Por Nacho Palou — 19 de Octubre de 2005

State of the Blogosphere — Technorati monitoriza actualmente 19,6 millones de weblogs y este número continúa doblándose cada cinco meses. La marca actual se ha conseguido en los últimos 36 meses. En otras palabras, la blogosfera [mundial] ha doblado su tamaño al menos cinco veces en los últimos tres años. O lo que es lo mismo, la blogosfera es ahora 30 veces más grande de lo que era hace tres años.

(Vía Neternity.)

Compartir en Flipboard  Compartir en Facebook  Tuitear

10 comentarios

#1 — Javi

Ayyy que os voy a tener que reñir por no ser lo suficientemente geeks... 2^5 = 32, así que la blogosfera es ahora 32 veces más grande de lo que era hace tres años ;)

#2 — Alvy

Pues regaña a Nacho, ¡que yo no he escrito eso! ;-)

#3 — Nacho

creo que dice "Ayyy" (hey, ciertamente para leer nos fijamos en la primera y última letra de la palabra! ;-))))

aw, es una cita que me he limitado a traducir, así que cualquier reclamación al autor original ;-))))

#4 — pezhammer

Unas reflexiones:

1) ¿De todos esos millones de blogs, cuántos son spam/basura, cuántos tienen menos de 10 entradas, y cuántos llevan sin actualizarse más de 6 meses?

2) ¿La Blogocosa vivirá su estallido puntocom?

3) Un blog repleto de faltas de ortografía y extrañas abreviaturas SMS es un blog?

4) ¿Se puede prescindir, a día de hoy, de otras fuentes offline y confiar en que la información que te proporciona la Blogocosa te permitirá hacerte un buen cuadro de la realidad?

5) ¿El tamaño realmente importa?

#5 — Tronfi

Ah, pero todavía puede seguir creciendo la blogosfera? creí que ya todos teniamos un blog.

#6 — Nacho

#4 en alguna parte del artículo enlazado se dice que el 4,6% de los blogs son spam o son falsos (no dice nada de blogs de hola-que-tal-y-nunca-más-se-supo

por lo visto otras fuentes hablan de un 20% (creo que Alvy tenía por ahí algo, a ver si puede dejar el enlace)

Diría que < 5% son pocos (el propio technorati está infestado, habitualmente utilizando las alertas por palabras aparecen varios de ellos. 20% diría que es más creíble / real pero incluyendo todo (spam, falsos, aceptablemente muertos)

#7 — Alvy

Los últimos datos a día de hoy sobre los splogs o «spam blogs» son por ejemplo Are splogs a form of bird flu, or just a PITA? donde se habla de:

According to David and Technorati, splogs are 4.6% of the blogosphere.

y por otro lado en ALT1040:

De acuerdo a Greg Linden de Findory el 95% de los weblogs son falsos, la mayoría probablemente blogs con spam (conocidos como splogs) muy contrastante con Technorati que dice siguirle la pista a 19.7 millones de blogs. El hecho es que Findory y Bloglines haciendo estudios separados llegaron a una conclusión similar es muy llamativo.
La horquilla es bastante «amplia» por lo que se ve. No creo que los datos de Findory sean muy representativos, es más creíble el 5% de Technorati, pero a saber cómo lo calculan, pued ser más, tal vez el 10, 20% incluso. En sitios como Blogspot se ha hablado hastas de un tercio (30-35%) de blogs que son spam.

En cualquier caso ese 5% ya serían 1 millón de blogs de spam que no es moco de pavo.

#8 — Anonymous

#5 y todos los demás, fuera caretas: yo soy el rarito que no tiene blog ni creo que llegue a tenerlo. ¿Por qué? Pues porque considero que no creando otro blog hago un gran favor a la humanidad no enrareciendo el universo del conocimiento humano con otra interferencia extraña. ¿Qué quiero decir con esto? Pues que estas cifras vertiginosas de blogs, páginas, información a tu alcance, etc. que fluyen por la red sólo representan el final de un círculo que comienza en la inopia total de la edad media y termina en la inopia total del siglo actual.
Suponiendo que la verdad exista, esta es tan difícil de alcanzar si está mezclada en igualdad de condiciones con varios billones de mentiras como si no está presente en absoluto.
A lo que voy es a que, además de lo fiable que pueda ser la información en un blog personal, la abundancia de estas fuentes lo único que hace es abrumar, gastar tiempo y, finalmente, no aportar nada de luz a lo que se pretende conocer.
Por más global que sea, una aldea es una aldea.

#9 — Nacho

a ver el boca-rana #8 que está haciendo interferencias en los comentarios! ;-)

Es coña, en parte la argumentación es válida y está muy en línea con lo que comentaba Dave Winer sobre la reputación de los blogs

En el futuro la gente se lo pensará dos veces antes de enlazar un sitio que no conoce
(vía Neternity, Reputation Systems Required)

De momento el único sistema de reputación válido o fiable es el tiempo: los sitios/autores veteranos y establecidos durante un tiempo en el que son conocidos por una masa suficiente (grande o pequeña, más allá de su madre y su mujer) tendrán la oportunidad de ganar reputación en su entorno o especialidad si la «inteligencia colectiva» de quienes lo leen así lo disponen. A larga lo falso se acaba delatando –y ni siquiera esta forma sería fiable del todo al 100%!

#10 — Abraldes

Por si resulta de interés, unos breves datos recogidos tras unas tres semanas aprox. (las tres últimas) haciendo una prueba de crawling de forma continua:

  • 84.432 feeds válidos monitorizados
  • En 38.921 la antigüedad del último post es mayor de un mes
  • 30.547 tienen 10 o más ítems
  • 42.630 tienen entre 3 y 9 ítems
  • 11.255 tienen 2 ó 1 ítem

El número total de ítems recogidos de entre todos esos feeds es de 2.239.425

Con feeds válidos me refiero a que:
1) Existen (status HTTP 200 OK) y son de acceso público
2) El parser los consigue procesar y detecta que hay contenido (al menos un item)

Todos fueron encontrados por una araña, partiendo de los 10.000 que tenía Feedmanía y siguendo enlaces a través de la Web. Los hay por tanto en varios idiomas, perteneciendo la inmensa mayoría a blogs, y tan sólo algunos a periódicos y otros servicios como Flickr o del.icio.us, que sindican sus contenidos.

En realidad la prueba ha sido sobre eficiencia en el crawling y almacenamiento de datos. Inevitablemente, ha proporcionado también ciertos datos relacionados con la actividad en los feeds a lo largo del tiempo, lo cual guarda relación con este post ;-)