viernes, junio 12, 2009
|
No hace mucho les hablé acá en eliax de HBase, un nuevo tipo de base de datos que implementa los mismos conceptos básicos que Google utiliza en sus cientos de miles de servidores para crear aplicaciones que escalan masivamente a millones de usuarios.
Hoy les hoy a hablar de una tecnología un poco relacionada y que Google recientemente hizo público en forma preliminar y experimental llamada Fusion Tables, que no es nada mas ni nada menos que una super potente herramienta para trabajar con grandes volúmenes de datos multi-dimensionales, en donde los datos los subes a la "nube de Internet" de Google, y después los manejas en tiempo real a tu antojo. Para el que tenga varios años lidiando con bases de datos avanzadas, en particular en entornos empresariales altamente demandantes en volumen de datos y sofisticados métodos de minar esos datos, esto es posible que les suene familiar, y la razón es que esta tecnología, así de inocente como se ve, está orientada a agarrar la yugular de una basecita de datos que todos conocemos como "Oracle". Efectivamente, lo que Fusion Tables hace es permitirte subir grandes cantidades de datos en formato tabulado (es decir, estructurado en filas y columnas), y después que los subes te ofrece una multitud de herramientas para que manipules y despliegues esos datos. Sin embargo, el poder de Fusion Tables no es solo ese, sino que además puedes subir otros juegos de datos, inclusives datos nada relacionados, y unirlos para ver patrones entre ellos. Inclusive puedes hacer el equivalente a una unión (join) en columnas comunes para hacer el proceso aun mas potente. Así que por ejemplo, puedes subir datos mensuales de los países en que (por ejemplo) se consumen mas golosinas, y después subes otro juego de datos mensuales de los países que consumen mas insulina recetada, y con Fusion Tables puedes unir ambos juegos de datos por las fechas y empezar a ver patrones entre ambos datos, y simulaciones entre los dos juegos de datos. Pero eso no es todo, es posible seguir agregando mas juegos de datos al mismo ejercicio, efectivamente permitiéndote analizar tus datos en tantas N-dimensiones como lo desees, cosa que hoy día era el reino de potentes (y caras) bases de datos y herramientas especializadas, y que ahora Google hace disponible gratuitamente. Además, así como puedes unir datos, puedes además filtrar de todas maneras imaginables, e incluso puedes graficar los datos con el Google Visualization API (una manera programática de generar todo tipo de gráficos, estándares o no), o hasta presentarlos en otros módulos de Google como Google Maps (de modo que en el ejemplo anterior de las golosinas y la insulina puedas ver todo graficado en un mapa del mundo por país con diferentes todos de colores u otros parámetros). Otro cualidad potente de Fusion Tables es que puedes compartir los datos con quien desees, e incluso permitir que otras personas manipulen los datos en tiempo real a la misma vez que tu. Incluso puedes compartir solo parte de los datos o de los resultados que generas, y si lo deseas lo puedes hacer todo público para que cualquiera tenga acceso a lo que haces. En todo momento, Fusion Tables incluso permite ingresar comentarios para que varias personas debatan los datos que ven en ese momento y llegar mas rápido a conclusiones. Y como si fuera poco, los resultados que obtienes de tus datos los puedes ingresar en cualquier otra página web, para que estos sean actualizado en tiempo real, de manera similar a como uno obtiene un poco de código HTML de YouTube para uno poder insertar los videos en cualquier página web. Pero recuerden, que en todo momento los datos tuyos están en la nube de servidores de Google, lo que significa que puedes tener acceso a ellos desde cualquier navegador web desde cualquier parte del mundo sin instalar absolutamente nada. Incluso Google te da la libertad de poder volver a sacar tus datos de la nube de Google y descargarlos de vuelta (junto con los resultados) a tu PC local, si eso hace que duermas mejor por las noches. Lo revolucionario de todo esto, no es solo esta funcionalidad que Google te ofrece, sino el hecho de que todo reside en "la nube", un concepto que cambia en 180 grados el concepto que uno tiene a la hora de analizar grandes volúmenes de datos, en donde las primeras preguntas que surgen son (1) ¿cuál base de datos elijo?, (2) ¿cuánto cuesta?, (3) ¿cuanto tiempo nos tomará instalar y crear la base de datos, y (4) ¿cuánto tiempo nos tomará simular todo esto? Ahora Google simplemente hace que ponderemos una sola pregunta: ¿Cómo entiendo mejor mis datos?, obviando por completo los detalles técnicos y yendo directamente al punto importante: En ser productivo y obtener respuestas. Lo irónico del caso es que sea Google quien esté lanzando esta tecnología, y no Oracle o IBM, pero después de pensar un par de segundos nos damos cuenta que este nuevo modelo de manipular datos es algo que tiene el potencial de reducir drásticamente los ingresos generados por las bases de datos tradicionales. La realidad mas bien es que es posible que los visionarios dentro de empresas como Oracle ya hayan pensado en estos escenarios hace mucho tiempo atrás, pero como toda nueva tecnología revolucionaria (y que tiene el potencial de comerse su propio negocio), prefieren esperar hasta el último momento posible, para de esa manera explotar lo mas posible a los clientes con el modelo tradicional actual. El riesgo que toman, sin embargo, es lo que acaba de suceder, que una empresa como Google arranque primero que ellos, y que sea considerada líder en esta nueva generación de herramientas. Por ahora Google lo que desea es retroalimentación de los usuarios de Fusion Tables, pues por ahora es solo un experimento en sus Google Labs, y por tanto existen ciertas restricciones (por ejemplo, el monto máximo por juego de datos es de 100MB, y la cantidad de datos máximo por usuario es de 250MB). Este es un excelente momento para unirte al proyecto, pues en esta etapa tienes mas influencia sobre hacia donde Google llevará este proyecto, ya que por ahora es un proyecto bastante desconocido, inclusive entre la comunidad de diseñadores de bases de datos. Y como siempre, pueden leer mas de mis opiniones y análisis en la sección bajo ese nombre a la derecha de la página principal de eliax. Página oficial de Fusion Tables en Google Labs Un mini-tour de Fusion Tables Anuncio oficial de Fusion Tables autor: josé elías |
8 comentarios |
Opinión / Análisis |
Comentarios
Añadir Comentario |
"Muchos dejan pasar desapercibida semejante valiosa información.
Creo que el mundo sería un lugar menos bueno sin Eliax."
Creo que el mundo sería un lugar menos bueno sin Eliax."
en camino a la singularidad...
©2005-2024 josé c. elías
todos los derechos reservados
como compartir los artículos de eliax
Seguir a @eliax
Researchers at the University of Rochester have digitally reproduced music in a file nearly * 1,000 times smaller than a regular MP3 file *. The music, a * 20-second clarinet solo, is encoded in less than a single kilobyte * , and is made possible by two innovations: recreating in a computer both the real-world physics of a clarinet and the physics of a clarinet player.
http://analogik.com/article_new_compression.asp