Introducción
El World Wide Web no sólo ha dado a conocer Internet al mundo entero, sino que ha producido un crecimiento espectacular de su utilización en un breve periodo de tiempo. La utilización de este novedoso medio de comunicación ha hecho posible un aumento de varios órdenes de magnitud tanto en la velocidad con que se añade información a la red como en la cantidad de información disponible.
Lo que el usuario de Internet demanda es la posibilidad de conseguir "cualquier información (texto, audio, vídeo), en cualquier momento y de forma precisa". En los últimos años han proliferado los servidores de información especializados en áreas concretas de conocimiento, pero se espera que sean los periódicos electrónicos los que faciliten la información de actualidad, aquella información de última hora que nos mantenga bien informados y que nos permita profundizar aún más si así lo requerimos.
En este sentido la aplicación de la tecnología Web al periodismo tiene un interés muy especial ya que la prensa electrónica tiene características propias que la distinguen de las ediciones en papel:
En este artículo presentamos el trabajo que estamos desarrollando en el Área de Ingeniería Telemática de la Universidad Carlos III de Madrid en colaboración con los Departamentos de Biblioteconomía y Documentación y de Humanidades y Comunicación dentro del proyecto El Periotrónico: Concepción y Desarrollo de un Periódico Personalizable. En las secciones 2 y 3 se revisan algunas de las tecnologías que más han influido en las decisiones de diseño. En el apartado 4 se da una visión de la arquitectura de la aplicación.
Lenguaje de marcado XML
El trabajo involucrado en el Web es inmenso en todas las direcciones, con la aparición de nuevos estándares que permiten nuevas posibilidades. Por lo tanto, para el diseño de un periódico electrónico, la tecnología empleada debe ser escogida con cuidado: lo que es usado hoy, se volverá obsoleto antes de lo que uno se imagina.
Una de las decisiones básicas de nuestro proyecto ha sido la selección de XML como lenguaje de etiquetado para la descripción de contenidos, en lugar de basarnos en la tecnología actual de HTML.
XML es el nuevo lenguaje de marcado ``extensible'' diseñado por el organismo regulador de tecnología del Web (W3 Consortium) que permite el uso por Internet de SGML (un estándar de marcado que lleva funcionando desde hace años en muchos dominios dedicados a la publicación de información escrita). XML permite ``inventar'' conjuntos de etiquetas de marcado de textos para dominios particulares de usuarios. Facilita la creación de lenguajes propios de marcado con los cuales conseguir los efectos especiales deseados. De esta forma no hay que intentar forzar un uso inadecuado de un lenguaje tan limitado y poco flexible como HTML. El contenido de la información es de este modo más fácil de manejar ya que XML provee mecanismos para catalogar, almacenar y buscar información estructurada en los documentos. Por otra parte, los mecanismos de hipertexto de XML son más ricos y flexibles que los de HTML.
Basándonos en estos principios hemos definido nuestro propio lenguaje JML (Journalism Mark-up Language) y hemos formalizado su gramática de acuerdo con las normas de XML mediante la expresión de su DTD (Document Type Definition).

Tecnología PUSH / PULL
Las últimas tendencias en periodismo electrónico se están enfocando en el uso de la tecnología PUSH, que permite que se puedan recibir las noticias del servidor del periódico sin que sea necesaria la intervención del usuario lector. De esta forma ya no tiene necesariamente que solicitar una actualización de sus páginas cada vez que quiera ver las novedades. Es el propio servidor de noticias el que se encarga de mantener actualizadas las páginas que están visualizando sus clientes mediante el uso de Canales. Los canales son conexiones entre el cliente y el servidor web en las que la información se actualiza de forma continua. Pero la tecnología PUSH requiere mantener recursos en el servidor en función del número de usuarios y del servicio que se quiera dar. Además esta tecnología aún no es estándar y no todos los canales funcionan en todos los navegadores.
Por el contrario en la tecnología PULL es el propio cliente el encargado de conectarse con el servidor, pero una vez hecha la conexión la información se actualiza automáticamente. Esto lleva a una descentralización del control, liberando de carga al servidor y permitiendo acceso así a un mayor número de usuarios simultáneamente.
En el periotrónico hemos optado por una combinación PUSH / PULL-Inteligente para aprovechar las ventajas de ambas tecnologías.
Personalización
El trabajo de un periódico no termina con la producción de su material. Es necesario llevar a cabo un proceso de selección de noticias que sea conforme a los intereses de cada lector. De esta forma se consigue, no sólo un mejor acercamiento del lector a la información que le interesa, sino además un aprovechamiento más útil de la capacidad de transmisión (ancho de banda) de la red.
Una de las labores del periódico consiste en saber caracterizar a los distintos lectores. Esta caracterización puede ser individual (si se tienen en cuenta las preferencias de cada lector de forma personal) o por grupos afines (se incluye al lector en el grupo de lectores interesados por unos mismos contenidos: Comunidades Virtuales). Las preferencias del lector deben ser también tenidas en cuenta en el momento de presentar la información, tanto en la estructura (posición de los distintos elementos en pantalla, color, tamaño de fuente, etc) como en la estrategia de navegación elegida (lineal, índice-subíndice, búsqueda, profundización, etc.)
En el Periotrónico el proceso de personalización tiene lugar en dos fases : la personalización de contenidos en el servidor (antes de enviar la noticia) y la presentación y estrategia de navegación en el visor del lector.

Arquitectura
Entre los distintos componentes que forman nuestro sistema figuran una base de datos, un servidor de noticias, un cliente para los periodistas y un cliente para los lectores. A continuación se describen cada uno de estos elementos.
La principal novedad es que cada uno de esos elementos almacenados en la base de datos contiene información sobre sí mismo (metadatos) que sirven para confeccionar los documentos en JML que se le presentan al lector.
Ejemplos de estos metadatos son algunas etiquetas relacionadas con el contenido : como el tipo de elemento (reportaje, entrevista, noticia, opinión, ...), la sección o secciones a la que pertenece (nacional, internacional, economía, deportes, ...), los distintos tipos de encabezamiento (título, antetítulo, subtítulo, entradilla, ...) y el cuerpo de la noticia. También podemos disponer de etiquetas básicas para la gestión como son los datos sobre el autor, la fecha y el lugar del suceso, enlaces a otras noticias con las que tenga relación, indicaciones sobre la conveniencia o no de que ciertos anuncios (publicidad) aparezcan cerca de ella etc.
Una de las etiquetas más importantes en nuestro lenguaje es el grado de importancia de una noticia, resultado de la importancia "objetiva" que le da el periódico unido a la importancia "subjetiva" que le atribuye el lector. Esta etiqueta nos permite decidir si una noticia debe presentarse o no a un determinado usuario en función de su relevancia y del interés que tenga para el lector en concreto. También podemos medir de este modo la obsolescencia de una noticia, decrementando el valor de la etiqueta con el tiempo.
El Servidor de Noticias es capaz de construir un periódico individualizado para cada lector basándose en las peticiones que éste formula y en un fichero con su perfil que contiene información sobre sus preferencias (parte declaradas por el mismo en el proceso de suscripción al periódico y parte aprendidas por el sistema a partir de las peticiones pasadas). El servidor de noticias tiene también en cuenta la antigüedad de la noticia, así como el grado de importancia asignado por el periódico a la noticia en sí misma con el fin de decidir su grado de resalte en la pantalla.
El periódico es enviado al cliente en formato JML.

Conclusiones
El espectacular crecimiento de Internet y la evolución cada vez más acelerada hacia las llamadas Sociedades de la Información han hecho evolucionar el concepto de prensa hacia un nuevo paradigma: El periodismo electrónico.
Nuestra propuesta va más allá de la simple publicación en HTML del material tradicional y la inclusión de algunos contenido multimedia. Estamos desarrollando un nuevo lenguaje de marcado JML basado en el estándar del W3 Consortium XML. En esta nueva semántica se definen etiquetas que hacen referencia tanto a la estructura de la noticia como a su contenido, y otros aspectos que facilitan su almacenaje, recuperación y gestión.
Estas etiquetas permiten la personalización del periódico, haciendo posible la selección de contenidos y facilitando distintas formas de presentación y navegación.
Referencias
[1] Richard Light: Presenting XML, Indianapolis: Sams Net 1997
[2] Dan Connolly: XML: Principles, Tools and Techniques, en: World Wide Web
Journal, 2-4, O'Reilly 1997
Agradecimientos
El trabajo en el que se basa este documento ha sido parcialmente financiado por el proyecto TEL97-0788 de la CICYT. Queremos agradecer las fructíferas aportaciones de nuestros compañeros Peter T. Breuer, Pilar Diezhandino, Tony Hernández, Natividad Martínez, Tomás Nogales, A. Rodríguez de las Heras y Luis Sánchez de la Universidad Carlos III de Madrid. Agradecemos también la ayuda prestada por El PAIS Digital y Fundesco.