¿Sabe
cuánta información podría extraerse de cada libro publicado? ¿Y
de un millón?
Aunque toda esa lectura sería imposible para cualquier ser humano,
un grupo de investigadores ha digitalizado 5,195,769 libros
(aproximadamente el cuatro por ciento de todos los libros jamás
publicados) y analizándolos con ayuda de la informática han
conseguido dibujar un interesante retrato de cómo ha cambiado el
mundo durante los últimos siglos. Jean-Baptiste Michel y sus colegas
de la Universidad de Harvard han bautizado a este experimento como
"culturómica" y, según explican en la revista Science,
su
método podría ser utilizado para campos tan diversos como la
evolución de la gramática, la memoria colectiva, los avances
tecnológicos, los efectos de la censura, los cambios en la dieta y
las enfermedades, o la epidemiología histórica, entre muchos otros.
En particular, este grupo de científicos escogió centrar sus análisis en el idioma inglés entre los años 1800 y 2000, rastreando cómo los cambios culturales, tales como la guerra y la esclavitud, están ligados a cambios lingüísticos. En total Michel y sus colegas analizaron más palabras en inglés que las que contiene cualquier diccionario, identificando algunos términos que han desaparecido de nuestro vocabulario a lo largo del tiempo, así como otras palabras que lentamente han ganado popularidad. Además, los investigadores rastrearon la fama mediante la medición de la frecuencia del nombre de una persona y llegaron a la conclusión de que la gente ahora es más famosa que lo que nunca antes, aunque también es olvidada más rápidamente que nunca.
En particular, este grupo de científicos escogió centrar sus análisis en el idioma inglés entre los años 1800 y 2000, rastreando cómo los cambios culturales, tales como la guerra y la esclavitud, están ligados a cambios lingüísticos. En total Michel y sus colegas analizaron más palabras en inglés que las que contiene cualquier diccionario, identificando algunos términos que han desaparecido de nuestro vocabulario a lo largo del tiempo, así como otras palabras que lentamente han ganado popularidad. Además, los investigadores rastrearon la fama mediante la medición de la frecuencia del nombre de una persona y llegaron a la conclusión de que la gente ahora es más famosa que lo que nunca antes, aunque también es olvidada más rápidamente que nunca.
Saber
cómo cambia nuestra cultura al igual que cómo cambia nuestro
genoma. Es el nuevo enfoque de un nuevo proyecto denominado
"culturómica”, un acrónimo que combina "cultura" y
"genómica".
Sus
responsables, los investigadores Erez Lieberman Aiden y Jean-Baptiste
Michel, del Programa de Dinámica Evolutiva de la Universidad de
Harvard, aseguran que mediante el seguimiento de la frecuencia del
uso de las palabras se pueden observar la aparición y evolución de
las tendencias culturales a través del tiempo.
Por
ejemplo, los libros en alemán publicados bajo la censura nazi entre
1936 y 1944 apenas mencionaban a algunos artistas y filósofos cuyos
nombres eran comunes antes y después de ese período.
El
análisis también identifica palabras que existían en libros
publicados pero que no tenían lugar en los diccionarios, como
"aridización". Cuando los investigadores sumaron todas las
palabras en el diccionario en inglés, contaban con más de un millón
Para
hacer este seguimiento, Aiden y Michel han creado una enorme base de
datos de palabras en alrededor de 5,2 millones de libros publicados
entre los años 1800 y 2000, aproximadamente el 4% de todos los
libros publicados.
Para
ello, la participación de Google ha sido esencial. Los libros se han
extraído del archivo de Google Books, cuya biblioteca contiene 15
millones de libros. Además, Google ha lanzando una aplicación en la
web Culturomics
que permite a cualquier persona acceder y analizar la base de datos
finalizada, que incluye 2 mil millones de palabras y frases.
No hay comentarios:
Publicar un comentario