Mi hija Ariadna acaba de presentar su proyecto fin de carrera, un bonito trabajo sobre aplicaciones bibliográficas usando Linked data, en el que ha puesto en conexión tres fuentes de datos: La DBpedia, la Biblioteca Nacional Española y la British National Bibliography.
Siguiendo como he podido su contenido y ayudándole en la preparación de la memoria para su presentación al tribunal examinador he llegado a entender aproximadamente el potencial enorme de esta tecnología estrechamente relacionada con la web semántica. Todo ello me ha sugerido algunas reflexiones.
Desde la primera vez que me conecté a Internet me pareció asombroso poder entrar en contacto de forma inmediata con gente o con información que se encontraban al otro lado del mundo. Ahora que entiendo mejor cómo funciona, todo eso me sigue pareciendo extraordinario, pero también veo más claro el caos que lo gobierna. Me refiero a tanta información dispersa, sin organizar, sin relacionar. Internet es un universo donde resulta fácil perderse, vagar de aquí para allá o llegar a cualquier sitio sin saber muy bien por qué.
Es verdad que los buscadores han introducido un nuevo orden en ese universo de información que está en continua expansión, como según parece lo está el universo de verdad. Google es uno de los mayores fenómenos sociales de nuestro tiempo y tiene una influencia única en lo que se refiere a la distribución de la información de forma global. Pero la lista de sus resultados de búsqueda está organizada y jerarquizada linealmente en función de criterios (200 según afirman ellos mismos) capaces, eso sí, de indexar con un sólo algoritmo los 30 billones de páginas web.
Los buscadores se relacionan con las páginas web una a una rastreando sus contenidos. Finalmente las ofrecen al usuario, pero sin establecer ningún vínculo entre ellas que no sea el de su mayor o menor proximidad en esa lista.
La relación entre el algoritmo y cada una de las páginas web listadas se establece de forma unilateral, en función de sofisticadas y secretas variables matemáticas que parten del deletreo del término o conjunto de términos utilizado, sus sinónimos y la proximidad semántica con otros términos para identificar contenidos que respondan al concepto buscado. Los gestores de los diferentes sitios web intentan organizar sus contenidos de acuerdo con estrategias SEO que optimicen en cada búsqueda la aparición de sus contenidos, lo que tiene una influencia definitiva en el valor económico de su web, que es en muchas ocasiones no sólo la web de una empresa sino la empresa misma.
El objetivo de un buscador es indexar todos los web site de la red y ofrecer la lista de resultados más relevantes al usuario, como explica de forma muy gráfica el enlace http://www.google.com/insidesearch/howsearchworks/thestory/. Se trata de uno de los mayores y más influyentes negocios actuales según demuestra la cotización de Google en la bolsa de valores. Los buscadores terminarán adoptando seguramente una enfoque de linked data para dar más valor a sus usuarios.
Dicen que fue el lenguaje lo que produjo el salto evolutivo de la especie humana. La escritura fue el primer método de almacenamiento y transmisión de la información. La imprenta hizo que la información pudiera distribuirse de forma masiva. Internet confiere a cada ser humano la capacidad para intervenir en este proceso desde cualquier rincón del globo. El linked data será un valioso instrumento de gestión del conocimiento, una especie de conector inteligente entre millones de neuronas cuyas capacidades se abrirán para poder ser vistas por dentro por todas las que puedan entenderse entre sí.
El impacto de este hecho sobre la ciencia, la educación, los negocios, el arte, la vida, parece casi de ciencia ficción. Podría visualizarse como una especie de cerebro colectivo en donde los seres humanos podrán «pensar juntos» a través de dispositivos que se entenderán entre sí, lo que permitirá avanzar más deprisa en cualquier dirección utilizando una inteligencia puesta en común y todas esas interacciones de confianza garantizadas por aplicaciones fiables.
El almacenaje de datos es un factor que ha revolucionado el conocimiento, pero la verdadera inteligencia reside en las conexiones, conexiones que además no se limitarán a «poner en contacto» u organizar en listas la información disponible, sino que servirán también para entenderse. Poner en común todas las cosas y sus relaciones, esa capacidad hará del mundo un lugar mejor, de los seres humanos personas más libres y del futuro inmediato, este presente continuo en el que ya vivimos, un tiempo apasionante. Sirva el sugerente artículo de Paolo Álvarez en El Confidencial «La poética de Google» como un buen ejemplo del resultado potencial de esas conexiones y la colaboración con la máquinas, utilizando simplemente la función de autocompletado del buscador.
Volviendo al contenido de la memoria, adjunto algunos párrafos textuales de su introducción:
«Acceder a la información útil en los archivos de hipertexto de la red puede ser laborioso y complicado, es decir, para entresacar los datos precisos que necesitamos, hay que leer cientos o miles de páginas que pueden contener la información buscada o hacer una referencia tangencial a la misma o no disponer de ella».
«Por otra parte, esta búsqueda de información no puede ser procesada por máquinas, lo que sin duda es una grave carencia, resuelta la cual, la evolución del mundo de las comunicaciones web, y por tanto de todas aquellas disciplinas que las utilicen –o lo que es lo mismo, todas- avanzará de manera exponencial».
«El proyecto presentado en esta memoria aborda estas cuestiones en una parcela del conocimiento que es uno de los pilares del saber humano: los libros (incluyendo publicaciones y textos de diversa índole). Pues los libros son los contenedores de la mayor parte del conocimiento, están llenos de historias, de ideas de sentimientos, de sensaciones, de propuestas, deducciones, relaciones, sueños, proyectos…».
Si alguien siente curiosidad por el contenido del proyecto de linked data de Ariadna puede encontrarlo aquí: http://wp.me/a2Rhz7-99