Por @Alvy — 2 de Noviembre de 2006

El otro día comentaba con alguien sobre cómo medir algunas cuestiones de efectividad en sitios web, en las interfaces de usuario, campañas publicitarias y demás. Eso me recordó una clásica historia sobre cómo Amazon, la tienda gigante de Internet, rediseña a veces detalles de su interfaz. Creo que la contó Chris Anderson hace unas semanas en una conferencia y que también se la oí a Andreas Weigend (ex-Amazon) en otra conferencia.

El caso es que en el Mundo Real™ las pruebas de «ensayo-y-error» suelen ser lentas y caras de realizar. Imagina que estás diseñando un coche y quieres probar si un tipo de ruedas o de volante es superior a otro. Tienes que diseñarlos, construir prototipos, montarlos en coches de verdad y darselo a probar a ingenieros, promediar los resultados, etc.

En la web, en cambio, esto es totalmente distinto. Imagina que un ingeniero de Amazon tiene un dilema: una duda sobre si el botón de «añadir al carrito» es mejor que vaya a la izquierda o a la derecha de la ventana. Amazon es un sitio web tan grande y tiene tantas visitas y compradores por minuto entrando en su tienda que puede permitirse el lujo de hacer una prueba de ensayo-y-error «en vivo y en directo». Prepara la prueba y pone dos versiones de la idea en las mismas páginas. Las reparte «al azar» entre los visitantes, de modo que la mitad vean una versión y la otra mitad, otra. Se espera un rato y se miden y analizan los resultados reales de lo que hicieron cientos o miles de compradores reales.

Si la prueba de ensayo-y-error está correctamente diseñada y el «factor» que se intenta aislar tiene sentido realmente, el resultado es casi instantáneo o se puede dar por válido a las pocas horas. Si obtienes algo como 51% vs. 49% tal vez la diferencia no sea significativa. Pero tal vez resulta que el 60% de la gente añade más objetos o lo hace más rápidamente si el icono está a la derecha, y el 40% si está a la izquierda. O tal vez el 70% hace clic en una oferta sugerida con un color frente al 30% que lo hace con otro. El coste de esa prueba es que la mitad de las veces clientes reales no realizaron las acciones de forma «óptima», pero a partir de las pruebas obtienes una interfaz que es objetivamente superior a la original. Se concluye que este tipo de pruebas, cuando se hacen y se hacen bien, son tremendamente poderosas para mejorar la interfaz y efectividad de los diversos elementos de un sitio web y de esa web en general.

Hay un montón de formas de equivocarse al hacer estas pruebas. Lo ideal es hacerlo en tiempo real y con visitantes reales, eligiéndolos al azar y aislando factores pequeños y fácilmente distinguibles. No vale probar un día con un grupo de gente y otro día con otro (o a unas horas con unos y a otras horas con otros) porque podrías estar llegando a gente distinta o sesgada, aunque a grandes rasgos eso también podría funcionar. No puedes fiarte si la muestra es muy pequeña, porque podría no ser suficientemente significativa. Necesitas cientos o miles de pruebas para poder fiarte de los resultados (pero para alguien grande con miles y miles de visitas por hora, eso no es un problema). La interpretación también debe ser precisa y en base a criterios objetivos, a ser posibles fijados de antemano para que no sean malinterpretados.

Naturalmente, este tipo de pruebas de interfaz y visibilidad, que se hacen rutinariamente en tiendas, webs o campañas publicitarias (la más clásica en anuncios en Internet, las pruebas A/B de AdSense) no son fáciles sino más bien laboriosas. El típico trabajo sucio que alguien tiene que hacer. Pero son tremendamente efectivas. Tampoco es «física nuclear» y lo mejor es que está al alcance de cualquiera que tenga una web, un poco de paciencia y conocimientos.

Compartir en Flipboard Publicar / Tuitear