La nueva solicitud de patente de Google convierte automáticamente publicaciones impresas en artículos electrónicos

En esta tarde anodina de domingo también tenemos algo que publicar en este blog. Es una noticia que no parece haber trascendido demasiado en la web hispanohablante, pero creo que es bastante interesante, así que voy a explicar un poco el tema.

Al parecer, Google presentó esta solicitud de patente en Agosto de 2008, pero no se ha hecho pública hasta esta semana pasada. La patente tiene por título Segmenting Printed Media Pages Into Articles y básicamente se trata de un método automatizado para convertir los artículos de publicaciones impresas, ya sea periódicos o revistas, en archivos electrónicos individuales publicables vía web. En resumen, la solicitud de patente dice así:

Métodos y sistemas para la segmentación de medios impresos en páginas de artículos individuales de manera rápida y eficiente. Los medios impresos basados en imágenes que pueden incluir una variedad de columnas, titulares, imágenes y texto se introducen en el sistema que comprende un segmentador de bloques y un sistema de segmentación de artículos. El segmentador de bloques identifica y produce bloques de contenido textual de una imagen en medios impresos, mientras que el sistema de segmentación de artículos determina qué bloques de contenido textual pertenecen a uno o más artículos en la imagen del medio impreso, basándose en un algoritmo clasificador. También se presenta un método para la segmentación de los medios impresos en páginas de artículos individuales.

Es evidente que las dificultades técnicas para llevar a cabo este proceso de segmentación van a ser muchas:

Los complejos medios materiales impresos, tales como los periódicos, a menudo incluyen columnas de texto, noticias, imágenes gráficas, varios tamaños de fuente, y comprenden múltiples artículos y elementos lógicos muy cerca uno del otro, en una sola página. Los intentos de utilizar el reconocimiento óptico de caracteres en tales situaciones son normalmente inadecuados y dan como resultado una amplia gama de errores como, por ejemplo, la imposibilidad de asociar de forma correcta el texto de varias columnas como del mismo artículo, asociar erróneamente las áreas de texto sin un titular asociado o los artículos que cruzan los límites de página, y la clasificación de fuentes de grandes titulares como una imagen gráfica.

La patente de Google describe cómo detectar bloques de texto y determinar cómo encajan entre sí en artículos, lo que tiene unas claras implicaciones:

  • Google podría dividir revistas y periódicos enteros en artículos web
  • podría almacenarlos y servirlos
  • podría incluirlos en los resultados de su buscador
  • podría poner publicidad en ellos

Sólo parece haber un pequeño problema jurídico: New York Times Co., et. al. v. Jonathan Tasini al. al. También llamado caso Tasini, se refiere a que escritores freelance demandaron al New York Times y a otras publicaciones por la concesión de licencias sobre artículos individuales a empresas de bases de datos sin el consentimiento de los autores, quienes tenían el copyright sobre sus artículos. Uno de los principales puntos de este asunto fue que los editores tenían permiso explícito sólo para incluir los artículos en la publicación impresa. Sin embargo, la ley de derechos de autor no permitía a los editores a romper sus publicaciones y hacer los artículos accesibles a los lectores fuera del contexto original.

Pues bien, la solicitud de patente de Google se refiere a hacer exactamente eso, así que ya veremos como se suceden los acontecimientos. En todo caso, lo que tengo claro es que esta patente no le va a hacer demasiada gracia a Rupert Murdoch.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s