The New York Times se vuelve más “semántico”

El otro día hablaba de Linked Data, como ese paradigma de datos vinculados sobre el que se asienta el concepto de Web Semántica para Tim Berners-Lee. Ahora leo que The New York Times, un periódico que siempre se ha caracterizado por implementar las últimas tecnologías con éxito -muy buena su app para Android- ha añadido un nuevo lote de descriptores a su nube de linked data. Hasta ahora estos encabezamientos sólo permitían hacer búsquedas de personas, lugares y organizaciones. A partir de ahora, con esta actualización, contendrá descriptores de materia:

While these subject headings are really useful, they only allow you to explore our archive in terms of “who” and “where.” Our descriptors allow you to query the archive in terms of “what” — and that allows you to find articles based on the subject they discuss.

Además, para la elección de estos descriptores de materia, han establecido una serie de convenciones:

  • notas de alcance: las han escrito para clarificar su uso de los descriptores, y por el por qué de la elección de unos y no otros para expresar determinados significados
  • términos genéricos y específicos: si un artículo trata, por ejemplo, de hormigas (únicamente), no se etiqueta también con el tag “insectos”. Se intenta etiquetar con el mayor grado de granularidad posible. Si el artículo trata de varios tipos de insecto, en ese caso sí se usaría esta etiqueta más amplia.
  • combinaciones de términos: para evitar el desorden inherente a un número creciente de descriptores, The New York Times decidió usar en ocasiones combinaciones de términos para expresar determinadas ideas. Esto lo ejemplifican así: Accidents and SafetyAirlines and AirplanesPlane Crash

Haciendo clic en la combinación de términos de arriba vamos directamente a la API  de búsqueda de artículos del periódico, donde podremos hacer más experimentos. En esta ocasión han actualizado con los 498 descriptores de uso más común, pero esperan llegar a los 3500 en los próximos meses. Incluso han puesto a disposición de los usuarios los ficheros SKOS para su estudio.

One thought on “The New York Times se vuelve más “semántico”

  1. Pingback: Materiales sobre Web Semántica y Linked Data | Doculinux

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s