July 2010


Desde que me incorporé al mundo laboral, hace unos 12 años, siempre nos hemos visto enfrentados al mismo problema. Llega la hora de almuerzo y nos empezamos a mirar las caras, proponer lugares, descartar otros tantos, tolerar a los mañosos, mirar por la ventana para ver si está lloviendo, todo esto para finalmente poder salir a almorzar.

Muchas veces el tomar la decisión fue un proceso bastante complejo, más aún si la cantidad de comensales era mayor a cuatro. Y otras muchas veces, el destino fue cambiado durante la caminata al lugar original, o bien al comprobar que no quedaban mesas disponibles.

Para resolver este problema, primero en modo de broma y luego más en serio, junto a los compañeros de trabajo actuales ideamos un algoritmo para decidir donde almorzábamos:

Algoritmo de Almuerzo

Algoritmo de Almuerzo

Por un par de semanas funcionó sin problemas. Incluso algunas veces servía para poder oponerse a la opción predeterminada. Pero luego nos dimos cuenta que la selección diaria empezaba a volverse rutinaria y que, de no haber lluvia, nuestro universo de locales de almuerzo se reducía a 6 (5 de Lunes a Viernes y uno más a fin de mes).

Esto planteó el desafío de un nuevo algoritmo, que permitiese tener más variedad de lugares. Luego se agregó como requerimiento que se pudiese poner una nota a cada lugar y que se llevara registro de la cantidad de veces que habíamos asistido a cada uno.

El modelo preliminar resultante fue bastante más complejo que el anterior. Dependiendo del puntaje de cada lugar, se llenaban lugares en una suerte de ruleta, la cual luego era revuelta. Aleatoriamente se elegía uno de los lugares de la ruleta y se procedía a lanzar la moneda.

El lanzamiento de moneda fue un detalle algo sádico que permitió incorporar el número de visitas en el algoritmo. Por cada visita que hubiésemos hecho al lugar preseleccionado, se lanzaba una moneda. Si salía cara, se volvía a lanzar. Si salía sello, se descartaba el lugar preseleccionado y se volvía a la ruleta. Luego, si un lugar había sido visitado 5 veces, debían salir 5 caras seguidas para que pasara de preseleccionado a seleccionado. Claramente si un lugar no había sido visitado nunca y era preseleccionado, automáticamente pasaba a seleccionado.

Luego, dado que se usa la nota de cada lugar para determinar la cantidad de veces que se repite en la ruleta, la probabilidad de preseleccionar un lugar es:

Probabilidad de Preselección

Probabilidad de Preselección

Y la probabilidad de selección de un preseleccionado es:

Probabilidad de Selección

Probabilidad de Selección

De esta forma, en general se privilegian los lugares mejor evaluados, pero evita que salga siempre el mismo al que vamos siempre, con lo que debería quedar un poco más parejo.

Comentarios, críticas, observaciones, oportunidades de mejora, todos son bien recibidos.

Advertisements

Para comenzar, debo decir que mis expectativas eran altas. El tema ya no es tan nuevo, hay mucho trabajo realizado en Internet, libros escritos, herramientas y gente que se ha adentrado en la materia. Desgraciadamente mis altas expectativas no fueron del todo satisfechas, creo que había más revuelo que contenido. Pero desde la perspectiva de que era necesario que existiese algún referente local, está bien. Es un buen punto de partida, porque permitió, entre otras cosas, tomarle el peso al arrastre que tiene el tema, a la necesidad de saber que tienen muchos, y a tener una pequeña vitrina donde poder aspirar a mostrar sus trabajos.

Hilando más fino, creo que la organización en general estuvo bien. El punto negro fue la falla de la videoconferencia con Sheila Pontis, quien se notó que tenía la mejor disposición del mundo, y por lo mismo duele más que las fallas técnicas locales (previsibles) frustraran su participación. El coffee break de 45 minutos para tratar de corregir el problemano fue suficiente. Y tener problemas de ancho de banda, cuando estás en la casa matriz de Movistar, se ve peor.

Me quedo con la sensación de que mucha de la gente que fue al evento esperaba que le dijeran el como hacer visualización de datos. Si esa era su expectativa, creo que se quedaron con las ganas.

Curiosamente, cuando vi el programa, pensé que la charla que menos me interesaría sería la de Paulo Saavedra, pues hablaría de los esfuerzos del gobierno para estandarizar la web de servicios. Y finalmente, sin sentir que directamente fuese sobre visualización de datos/información, fue la charla que más disfruté. Entre su capacidad de entregar su charla en forma amena y presentar un desarrollo de un tema en forma coherente, y con resultados concretos, fue el que más brilló.

Respecto de los otros charlistas, Christián Oyarzún pudo haber mostrado su proyecto Fault en 5 minutos y haberse retirado. En cambio, tuvimos que soportar su volada y en los últimos 5 minutos presentó Fault. Rodrigo Duarte le puso empeño, pero sentí que estaba mostrando un proyecto comercial y que respondió desde esa perspectiva las preguntas que buscaban a un evangelista de la visualización de datos.

Destacaron algunos integrantes del público que hacían preguntas de 3 minutos, donde los primeros 2 minutos y medio eran autoreferencia y el remanente era una pregunta casi retórica.

Dignos de destacar en la mesa redonda fueron Herbert Spencer, que nos trajo el fuego de Fry, y Mario Saavedra que habló desde la experiencia concreta y con mucha sensatez (y con un par de zapatillas con personalidad propia).

Espero ansioso la próxima iteración de Big Bang Data porque sé que será mejor. Era necesario tener una primera instancia para poder empezar a iterar y mejorar. Se ha cumplido con ser la primera instancia, esperamos que de ahora en adelante todo mejore.

#BigBangData #bbd10