Preservando el conocimiento digital: el Archivo de la Web

Hemos tenido un día complicado con la mudanza, empaquetando enseres para el cambio de dependencias de IPR-Helpdesk, ya que nos movemos a la Facultad de Ciencias. No ha habido mucho tiempo para mirar cosas, pero sí he podido echar el ojo a este informe que gira en torno al concepto de Web Archiving. ¿Y de qué va eso? Pues he encontrado una definición muy válida en la Wikipedia:

Web archiving is the process of collecting portions of the World Wide Web and ensuring the collection is preserved in an archive, such as an archive site, for future researchers, historians, and the public. Due to the massive size of the Web, web archivists typically employ web crawlers for automated collection. The largest web archiving organization based on a crawling approach is the Internet Archive which strives to maintain an archive of the entire Web. National libraries, national archives and various consortia of organizations are also involved in archiving culturally important Web content. Commercial web archiving software and services are also available to organizations who need to archive their own web content for corporate heritage, regulatory, or legal purposes.

Lo que queda claro es que Web Archiving comprende una serie de técnicas para capturar instantáneas de la WWW. La motivación original de hacer estas capturas ha sido la de observar la evolución de la web. Ahora bien, centrándonos en el interés que una organización puede tener en esto del Web Archiving, The Preservation of Web Resources Handbook nos dice:

  • Los sitios web proveen evidencias de la actividad de la organización: pueden contener pruebas valiosas en situaciones de auditoría o investigaciones, también pueden ser interesantes desde un punto de vista promocional, por ejemplo dotando de contexto histórico ciertas celebraciones, como aniversarios.
  • Las páginas web son un valioso registro de la información publicada por la organización.
  • Aunque los sitios web contienen información que tiende a ser efímera, esta sí puede ser utilizada en un futuro si se conserva convenientemente.

También desde un punto de vista estadístico, el estudio de los recursos web archivados puede responder a preguntas como:

  • ¿Cómo ha cambiado la web la sociedad? (análisis en base a los cambios en el tráfico web)
  • ¿Cómo ha evolucionado un sitio web concreto en el tiempo?
  • ¿Cómo ha cambiado el lenguaje de un sitio web concreto a lo largo del tiempo?
  • ¿Qué formatos se han usado, y cómo han cambiado con el tiempo?

Pero claro, para alcanzar a responder estas y otras preguntas, el Web Archiving se enfrenta a una serie de retos técnicos que debe superar, como la captura de enlaces ocultos, de blogs, de páginas web y portales institucionales o incluso la extracción de información de mundos virtuales.

En el informe (de 34 páginas) se analizan en profundidad estas cuestiones y se ofrece bibliografía abundante sobre el tema. ¿Estamos viviendo el nacimiento de un nuevo tipo de archiveros, los web archivists? Parece que la evolución desde el medio físico al digital va a cambiar también ámbito de trabajo de estos profesionales, que como custodios de la memoria, van a tener que empezar a preservar también la web.

Más información aquí y aquí.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s