Seguimos hablando de Web Semántica

He estado leyendo a ratos alguna cosa interesante en este sentido y me gustaría compartirlo. A falta de tiempo para entradas más elaboradas, este tampoco es un mal sucedáneo.

Quiero empezar hablando de un estupendo trabajo (bajo licencia GPL) de Philipp Heim (Universidad de Stuttgart), Steffen Lohmann (Universidad Carlos III de Madrid) y Timo Stegemann (Universidad de Duisburg-Essen). Este desarrollo toma datos estructurados y permite encontrar relaciones entre dos o más entidades. La herramienta funciona realmente bien con resultados espectaculares, merece la pena probar a introducir los términos “Felipe González” y “José Luis Rodríguez Zapatero” y ver cómo se tejen las relaciones entre ambos, mientras van apareciendo otras entidades también relacionadas (Rajoy, Aznar, etc.). Si hacemos clic en alguna de estas entidades vamos a una página de dbpedia.org con información adicional.

Sería interesante crear un método automático basado en el lenguaje natural (y tal vez en LSI) para generar conjuntos de datos estructurados (RDF) a partir de la información contenida en periódicos, blogs y redes sociales como Twitter o Facebook. Por ejemplo, no es difícil estructurar el contenido de una página web en un mapa de entidades a partir de su URL. Pongamos por ejemplo esta página en Techcrunch que se puede visualizar así. Es evidente que las redes sociales han supuesto una segunda explosión de internet (2.0), que está generando cantidades inimaginables de datos; estos datos tienen un valor en la medida en que puedan estructurarse y obtener conocimiento de ellos.

Este tipo de desarrollos que describen automáticamente recursos para después encontrar todas las relaciones posibles entre ellos van a ser muy importantes a medida que la Web Semántica vaya entrando en nuestras vidas. Existen herramientas que permiten encontrar toda la información más reciente acumulada en prácticamente toda la órbita de internet, estamos hablando de blogs, noticias, vídeo, imágenes, libros, redes sociales… Un ejemplo de esto podría ser Track this now, que devuelve una abrumadora cantidad de resultados de la presencia en la red de la entidad que buscamos. ¿No es interesante?. Viendo este tipo de desarrollos no dudo de que el futuro de la web es una cuestión de semántica.

Más aquí: Semantic progress.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s