domingo, enero 16, 2011
|
Como ya sabrán, Google ha digitalizado millones de libros a su base de datos, y no solo en formato de imágenes sino que con reconocimiento artificial de caracteres, lo que significa que existe un océano de datos esperando a ser minados, y una curiosa herramienta diseñada para minar esos datos es el Google Ngran Viewer.
El Ngran Viewer es una herramienta en donde puedes poner dos o más palabras y/o frases (separadas por comas, y por el momento en inglés), y este te devuelve una gráfica que te indica la popularidad y/o uso de las palabras o frases que escribiste a través de los años, lo que estoy seguro será de utilidad para muchos estudios estadísticos de todo tipo (y en particular en estudios lingüistas) en los próximos años. Como ejemplo, vean esta comparación que acabo de hacer entre las palabras Superman, Batman y Spideman entre los años 1800 al 2008. Página oficial del Google Ngram Viewer Preguntas Frecuentes y datos técnicos sobre el Ngram Viewer Actualización: Como aclara el lector Victor Suarez en el comentario #6, hay que tener cuidado ya que Ngram entiende las mismas palabras con mayúsculas o minúsculas de forma diferente. Y como aclara el lector Samuel S. en el comentario #7, Ngran ya puede funcionar con palabras y frases en español. autor: josé elías |
12 comentarios |
Curiosidades , Google |
Comentarios
Añadir Comentario |
en camino a la singularidad...
©2005-2024 josé c. elías
todos los derechos reservados
como compartir los artículos de eliax
Seguir a @eliax
Mira esta, me imagino porque el Internet no se menciona mucho en esos textos, pues es algo relativamente nuevo. Pero miren el radio y la tv.