Introducción
En el ámbito editorial se ha identificado que no es fácil costear la inversión provocada por la irrupción tecnológica en el trabajo editorial o cadena de valor del libro (G&G, 2020) y, en consecuencia, la producción de metadatos no es una práctica común para los editores, por lo que sólo en algunos estratos editoriales y en países con mayor desarrollo se da la posibilidad de que el editor incorpore metadatos en las entregas que hacen a las bibliotecas para la preservación de los libros digitales (LLC-EUA, 2018), lo cual complica las acciones de resguardo de las entidades depositarias.
Además, la industria editorial ha expresado la necesidad de implementar sistemas de gestión e intercambio de metadatos para facilitar la comercialización y la difusión de las publicaciones a partir del cambio en la cadena de valor del libro (G&G, 2020), lo cual, desde su perspectiva, facilitaría la producción de metadatos, de ahí que reconozcan la necesidad de fabricar software y las ventajas de contar con en el apoyo de profesionales en Ingeniería de Software para la creación, distribución y comercialización de libros digitales (Piedras, 2013).
Aunado a esto, Dappert y Enders mencionan que modelos para preservación digital -como OAIS- resaltan la importancia de los metadatos para facilitar la organización y el control de los materiales digitales (Dappert y Enders, 2010) y, también en el ámbito de la preservación a largo plazo de objetos digitales, existe la tendencia “More Product, Less Process” o MPLP (Owens, 2018) que promueve el control y la organización de los materiales digitales con una inversión menor de recursos, gracias al aprovechamiento de la información generada durante la producción de la publicación digital, lo cual podría beneficiar, en general, la entrega de libros a entidades encargadas de su resguardo.
Por todo lo anterior, en este artículo se resume un trabajo de investigación con el cual se propone un modelo que busca orientar la construcción de libros digitales con metadatos para preservación desde la edición, a partir de la identificación de metadatos básicos desde una mirada al libro como software, empleando conceptos del modelo OAIS, FRBR, el ciclo de vida del libro, el estándar ISO 25010 de calidad de software y un proceso generado de la cadena de valor del libro transformada por prácticas de ingeniería de software.
Metodología
La investigación aquí descrita se desarrolló en tres etapas. La primera etapa contempló el análisis y la revisión de conceptos para entender la importancia de los metadatos, y lo referente al libro digital y su esencia como libro y como software, además del estudio de su cadena de valor para comprender cómo ha cambiado la edición y resaltar el porqué de su relación con la Ingeniería de Software.
Lo segunda etapa contempló la especificación de la muestra y la recolección de datos, la cual se basó en “una muestra de casos tipo y por oportunidad” (Hernández S., 2014) a partir de la selección de diversas perspectivas de edición que describen cuatro fenómenos diferentes:
La edición de materiales impresos que integra libros digitales en el mismo proceso.
La experiencia de la autoedición.
El proceso de edición de una publicación digital.
Y recomendaciones para publicaciones digitales.
Durante esta etapa, se revisó cada uno de los casos a partir de las siguientes unidades de análisis, para identificar concordancias y diferencias (Hernández S., 2014):
Además, el procedimiento utilizado para el análisis fue el señalado por Hernández Sampieri como “teoría fundamentada” (Hernández S., 2014: 422), pues parte del uso de prácticas de ingeniería de software en donde los datos encontrados se fueron organizando en un proceso iterativo conocido en la investigación cualitativa como “diseño sistemático”, con el cual la información recolectada se analizó en cuatro procesos (Hernández S., 2014: 474):
Lo anterior permitió generar un “paradigma codificado” para la creación de un proceso editorial que contempló las coincidencias derivadas del análisis de las cuatro perspectivas de la edición, y después permitió la construcción del modelo en una tercera etapa.
La última etapa fue la construcción del modelo, generado a partir de teorías fundamentadas y la aplicación de prácticas de ingeniería de software, para lo cual se utilizaron conceptos establecidos en FRBR, el modelo OAIS, el ciclo de vida del libro, ISO 25010 de calidad de software y el proceso editorial derivado de las primeras dos etapas.
El libro digital como SOFTWARE
Desde la perspectiva de Schnapp y Raven, la esencia del libro digital está en los cambios que derivan de las nuevas técnicas empleadas en su construcción y que generan nuevas necesidades en la edición, publicación, distribución y hasta en la lectura (Schnapp y Raven, 2020). De ahí que la investigación que aquí se describe parte del análisis de la naturaleza del libro digital como software y su relación con la Ingeniería de Software.
Así pues, para entender al libro como software, es necesario comprender el alcance de la palabra “software”, acuñada en 1958, para hacer referencia a los componentes de la computadora que no son hardware (P. Bourque y Fairley, 2014: XVII) y que, en ocasiones, resulta complicado de distinguir, pues “[e]l software se puede instanciar en hardware, como cuando se graba en un CD-ROM para su distribución, pero el CD no es el software; su información almacenada lo es” (Reilly, 2003: 238).
Esta analogía de Reilly es aplicable al libro digital, pues es común referirse al hardware como si éste fuera el libro. De ahí que esta fusión entre lo intangible y lo físico se percibe en definiciones del libro digital, como la de Barker, quien lo describe como “una metáfora o mito generalizado que proyecta una imagen tanto para los diseñadores como para los usuarios de ser como un libro ‘de papel’ ” (Barker, citado por Henke, 2012: 19).
Además, la sensación que se genera al leer un libro digital en un dispositivo como el iPad o el Kindle nunca es la misma que al leer en una computadora de escritorio, de ahí que es común referirse al dispositivo de lectura como si fuera el libro digital, ya que es el propio dispositivo el que induce al lector a percibirlo como la “adaptación de metáforas de libros en papel” (Feldman, citado por Henke, 2012: 19).
Esto también se puede explicar desde el punto de vista de la informática cognitiva, en donde el software es un producto de la tecnología y se presenta como un modelo abstracto de un objeto del mundo físico (Wang, 2002b).
El modelo de Wang se construye a partir de Información-Materia-Energía (IME) y parte de la idea según la cual los seres humanos viven en dos mundos, un mundo físico y un mundo abstracto. En donde el mundo natural o físico se construye a partir de materia y energía, y el mundo abstracto se constituye con información que se deriva del mundo físico. Véase Figura 1. (Wang, 2002a).
Para Wang, la información se genera de aspectos del mundo natural y procesos que permiten representarla y materializarla cognitivamente en el ámbito digital como un software (Wang, 2002a), definido por el autor como “un tipo especial de información con comportamiento computacional que va a permitir la interacción entre el mundo abstracto y el mundo físico” (Wang, 2008: 12-13).
Derivado de lo anterior es que, para la investigación que aquí se describe, el libro digital se define, desde la perspectiva del software, como
[u]n software, objeto digital o tipo especial de información constituido en uno o más formatos de archivo de computadora con comportamiento computacional para abstraer la idea del libro en el mundo material, que requieren de un sistema informático (con nuevas dinámicas en su ciclo de vida y cadena de valor) para lograr interactuar con el mundo físico, es decir, dispositivos de hardware, otras piezas de software (programas de computadora y otros objetos digitales) y documentación asociada como metadatos (Ramírez-Molina, 2022).
La preservación digital
Respecto al concepto de preservación digital, cabe señalar que éste se ha transformado con el paso del tiempo, pues surgió, a principios de los años noventa*, a partir del impulso de la digitalización del libro impreso; sin embargo, en el año 2003 cambió, debido a la identificación de vulnerabilidades relacionadas con la vida de los documentos en el ámbito digital. Y fue así que la UNESCO, en ese año, hizo un llamado para proteger la producción digital, considerada desde ese momento como “patrimonio digital” (UNESCO, 2003), con lo cual se resaltó que digitalizar no era hacer preservación digital y, además, que las imágenes y archivos de computadora generados por la digitalización debían ser tratados para perdurar en el tiempo (UNESCO y BNA, 2003).
También es importante señalar que la preservación digital tampoco se reduce sólo a procesos técnicos como respaldos o copias de información, pues implica un cambio organizacional (Voutssás, 2011) para el tratamiento y cuidado de los objetos digitales, de ahí que, para fines del trabajo que aquí se presenta y después del análisis de diversas definiciones, se estableció que:
La preservación digital es una estrategia organizacional que implica orientar principios, políticas y normas (económicas, legales, organizacionales, tecnológicas y de producción) dentro de las instituciones para gestionar la permanencia de un objeto digital (que incluye a los libros electrónicos o digitales y digitalizados de un impreso, entre otros) contemplando procesos y técnicas estructuradas y perfeccionadas a través del tiempo y los avances tecnológicos configuradas como estrategias tecnológicas para el mantenimiento de los objetos, encaminadas al cuidado de la autenticidad, fiabilidad y exactitud de éstos, para lograr conservar, en lo posible, las características de acceso, uso e inteligibilidad original (manera en que fue concebido para su acceso, percepción y utilización) (Ramírez-Molina, 2022).
Los metadatos para preservación
Los metadatos, de acuerdo con Howe, son “datos acerca de datos” (Howe, 2010); sin embargo, Pomerantz considera que esta definición es poco clara pues, para él, el dato es información en bruto y el metadato no, pues proporciona información (Pomerantz, 2015).
Además, Senso y Rosa Piñero refieren que Ercegovac describe a los metadatos desde una visión archivística, en la cual la intención es representar e identificar un documento con la finalidad de recuperarlo y así informar en cualquier momento del estado de su autenticidad, valor, interoperabilidad, condiciones de uso y preservación (Senso y Rosa Piñero, 2003).
Lo anterior también nos lleva a señalar que los metadatos implican procesos de gestión documental, descritos en normas como la ISO 23081-1:2006, que define a los metadatos como “información estructurada o semiestructurada que posibilita la creación, registro, clasificación, acceso, conservación y disposición de los documentos a lo largo del tiempo y dentro de un mismo dominio o entre dominios diferentes” (REDC, 2008: 276).
Esta norma señala dos tipos de metadatos: por un lado, la información requerida para la incorporación de un documento en un ambiente de gestión y, por el otro, los metadatos generados una vez incorporado el documento al sistema de gestión.
En este sentido, el modelo de información de OAIS también concuerda con la visión de metadatos de la norma ISO-23081.1: 2006, pues especifica dos elementos empaquetados IP (Information Packaging) (CCSDS, 2012), que contemplan metadatos generados durante la ingesta y aquellos que son resultados de la gestión (DPC y OCL, 2005).
Información de contenido CI (Content Information).
Información de descripcción de preservación PDI (Preservation Description Information).
Lo anterior se complementa con el alcance definido por la UNESCO para la especificación de los metadatos para preservación a partir de seis elementos (UNESCO y BNA, 2003: 100):
La descripción del material a partir de un plan o programa de preservación.
La identificación de cuáles son los elementos de información necesarios para mantener y proteger el material.
La identificación de cuál es la información que permitirá representar al objeto cuando el usuario requiera consultarlo y las tecnologías de acceso y almacenamiento cambien.
El registro continuo de la historia del objeto, que conlleva documentar las consecuencias de lo que le va sucediendo durante su conservación.
Contener la información que documenta la identidad, integridad y autenticidad del objeto para certificarlo en cualquier momento, presente y futuro.
La información que permita comprender el contexto del objeto, durante su almacenamiento y uso.
De lo anterior fue que para este trabajo de investigación se identificaron dos tipos de metadatos en el ámbito de la preservación digital: los metadatos para preservación y los metadatos de preservación. Estos últimos se refieren a la información generada dentro del sistema de gestión documental derivada de los procesos de conservación del objeto, como verificaciones, migraciones y cambios de formato, entre otros (DPC y OCL, 2005).
Los metadatos para preservación, por el otro lado, se especifican como un modelo de información compuesto por varios paquetes de información (UNESCO y BNA, 2003) en el cual se encuentra tanto la información recibida por el editor como la que se genera al recibir el paquete en el sistema de gestión documental, que incluye también el paquete de información que concentra los metadatos de preservación.
La edición del libro digital
Para hablar de la edición del libro digital, Gerardo Kloss considera que lo adecuado es partir de las tareas y funciones implicadas (Kloss Fernández del Castillo, 2020) y, en ese sentido, Gil y Rodríguez refieren que la cadena de valor del libro digital requiere de la participación de especialistas con el dominio de habilidades tecnológicas que ayuden al editor a comprender esta nueva forma de producción (Gil y Rodríguez, 2011).
Ahora bien, desde la visión centrada en el software, su construcción implica conocimientos de Ingeniería de Software que parten de la comprensión y análisis de seis elementos básicos involucrados en el proceso cognitivo de construcción de cualquier software: Entradas, Criterios aplicables a las entradas, Actividades de transformación, Tareas, Criterios de salida, y la obtención de un resultado o software. (Bourque y Fairley, 2014: 8-3). Véase la Figura 2.
Además, desde esta perspectiva, estos elementos demandan el establecimiento de acciones que ayuden a controlar el proceso para la creación de software. Y, para esto, ESSENCE o núcleo de la Ingeniería de Software describe las “cosas con las que siempre se trabaja”, “cosas que siempre se hacen” y “habilidades que es necesario tener” (Jacobson et al., 2012) para lograr la construcción de un software.
De ahí que en este trabajo de investigación se definió un proceso editorial para el libro digital, basado en elementos esenciales de ingeniería de software aplicables a la edición y derivado del análisis de una muestra de casos documentados de procesos editoriales, seleccionados por cubrir los siguientes supuestos: un proceso editorial de materiales impresos que contempla versiones digitales, la autoedición, un proceso de edición digital, y las recomendaciones de la Digital Publishing Interest Group.
Con esto, se identificó que existen cuatro elementos clave para la edición del libro digital:
Establecer el alcance y la composición de la publicación.
Definir criterios básicos de calidad desde la visión del software.
Trabajo colaborativo de todos los involucrados.
Verificación y control del proceso de producción y de publicación.
El proceso editorial generado permitió establecer el punto de partida para el desarrollo del modelo.
Modelo de integración de metadatos para preservación en la edición del libro digital
El modelo está representado con un lenguaje conocido en la Ingeniería de Software como UML y su alcance está definido por la conceptualización de modelo de Achinstein (1967), por el que éste explica, en ocho niveles, los mecanismos que permiten la integración de metadatos para preservación en la edición del libro digital a partir de:
Establecer un conjunto de supuestos respecto al libro digital, su edición y los metadatos para preservación.
Describir el ambiente alrededor del libro digital, es decir, el sistema organizacional que lo respalda y exhibe las propiedades básicas del libro referidas como metadatos para preservación.
Es una aproximación de lo que implica la edición del libro digital para la integración de metadatos para preservación.
Parte de perspectivas establecidas en la calidad del libro digital que surgen de su estructura y composición como software, referenciado en metadatos para preservación.
El primer nivel del modelo se deriva de FRBR (véase Figura 3) y muestra los componentes de la publicación que incluye a la obra, expresión, manifestación e ítem, y las relaciones que existen entre ellos desde la perspectiva editorial: trasladar, producir y distribuir, además de los elementos de contenido importantes para cada uno: contenido intelectual, lenguaje de comunicación, arquitectura de información, metadatos y documentación (Ramírez-Molina, 2022).
El nivel 2 se basa en el modelo FRBR y el circuito de comunicación del libro (Robert Darnton, editado por Finkelstein, McCleery, y Finkelstein, 2006: 12) para identificar a las entidades que participan en la publicación y que en este modelo (Figura 4) se representan como (Ramírez-Molina, 2022):
Ente-Autor: el o los creadores de la obra y la expresión.
Ente-Editor: partícipes en la edición, que incluye las etapas definidas en el proceso editorial (control editorial, producción, calidad del software en la edición y distribución).
Ente-Poseedor: agrupa tres perspectivas de receptores de la publicación: Comercial, Consumo y Custodia.
El nivel 3 del modelo hace una descomposición de lo establecido en el nivel 2 en las entidades involucradas como poseedoras de la publicación, y surgen (Figura 5) las siguientes clases de participantes (Ramírez-Molina, 2022):
Ente-Patrocinador, que aporta los recursos para la creación y la publicación de la obra
Ente-Distribuidor, hace público el producto editorial ya sea con fines comerciales o de difusión
Ente-Consumidor, utiliza la publicación; también denominado en el modelo OAIS como comunidad designada, y
Ente-Archivo o encargado de la custodia, nombrado así por el modelo OAIS. No se refiere a una única institución, ya que para cada tipología de documento pueden existir interesados o responsables diversos.
Además, se identifican dos tipos más de participación: la participación directa, para quienes ejecutan acciones relacionadas con la producción, y la participación indirecta, para quienes son sólo referentes para la definición de criterios, políticas, estándares, tendencias o necesidades de la publicación (Ramírez-Molina, 2022).
El nivel 4 se basa en el ambiente definido en el modelo OAIS para representar dos paquetes de entidades. Véase Figura 6 (Ramírez-Molina, 2022):
Ente-Productor: contempla Ente-Patrocinador, Ente-Distribuidor, Ente-Autor y Ente-Editor, y
Ente-Regulador: contempla al Ente-Archivo y al Ente-Consumidor.
Con este diagrama también se establece la relación Ente-Productor vs. Ente-Regulador, basada en el hecho de que la publicación se dirige o conduce por la satisfacción de las necesidades de lectura y de servicio generadas por el Ente-Archivo y su comunidad designada o Ente-Consumidor.
El nivel 5, por otro lado, se deriva del modelo de información definido en OAIS y retoma el nivel 1 del modelo planteado en esta investigación, para identificar cómo se compone una publicación preparada para preservación, a partir del paquete AIP, establecido en OAIS (Gartner y Lavoie, 2013), conformado por dos elementos. Véase Figura 7 (Ramírez-Molina, 2022):
un objeto dato contenido (CDO): elementos del nivel 1 del modelo, y
la información de representación (RI): incorporada como metadatos y documentación derivada de los diversos componentes definidos para la publicación.
Para el nivel 6 del modelo, se introdujo lo que en esta investigación se identificó como criterios de calidad de software, como atributos que ayudan a describir la publicación digital: Funcionalidad, Fiabilidad, Usabilidad, Eficiencia, Mantenimiento, Portabilidad, Compatibilidad y Seguridad, todos éstos ubicados como Información de Contenido, a excepción del Mantenimiento, que desde la perspectiva del libro digital va a contemplar elementos que priorizan la preservación del contenido, incorporando mecanismos que facilitan el traslado a otros formatos, además de generar la documentación suficiente y adecuada para el entendimiento y manejo del libro, una vez que se encuentra en uso (Ramírez-Molina, 2022). Véase Figura 8.
El penúltimo nivel del modelo, el nivel 7, representa, a grandes rasgos, los elementos identificados en el proceso diseñado en la etapa dos de esta investigación y permite visualizar la asociación entre el Ente-Editor y la etapa controlar calidad del software y el resto de los participantes, que incluye las cuatro etapas definidas en el proceso editorial, representado todo con un diagrama UML de casos de uso, que permite abstraer cada etapa del proceso e incluir a los actores participantes (Ramírez-Molina, 2022). Véase Figura 9.
Finalmente, el último nivel del modelo representa el Trabajo colaborativo de todos los involucrados a partir de los factores identificados en esta investigación como participantes en la edición: el software, los procedimientos, las reglas de negocio, los recursos humanos y la documentación asociada, basado en el ciclo de vida del libro, y que agrupa todos los elementos analizados (Ramírez-Molina, 2022). Véase Figura 10.
Conclusiones
El desarrollo del modelo permite bosquejar para los editores y la comunidad preocupada por la preservación del libro digital los metadatos básicos para preservación, y parte del análisis de varios conceptos, entre ellos el de libro digital y su naturaleza como software, lo cual implicó la definición de éste, acorde con esta perspectiva.
También se identificó la diferencia entre los metadatos de preservación y los metadatos para preservación, que incluyen otros subconjuntos de información, descriptiva y legal, además de los metadatos de preservación.
Se identificaron metadatos básicos del libro digital que se derivan de su naturaleza como software, definidos como atributos de calidad de software, pues describen y controlan características referentes a su funcionalidad, usabilidad, fiabilidad, eficiencia, portabilidad, compatibilidad, seguridad y mantenibilidad.
El desarrollo del proceso editorial propuesto en la investigación sirve como referencia del modelo y además permite a los editores identificar elementos que en la práctica indican que:
Existe una parte del proceso de edición digital que es muy similar al proceso editorial tradicional.
La edición contempla una etapa relacionada con la generación del objeto digital, en donde se definirán formatos de archivo e incluso puede ser necesario incluir actividades de programación, además de elementos que garanticen la seguridad informática de la publicación.
Existe una etapa para la distribución del objeto, también identificada con el concepto de tienda electrónica; sin embargo, lo importante no es que se comercialice, sino definir las formas de publicar, distribuir o hacer visible el libro, ya que esto también forma parte del alcance de la publicación.
Se requiere de un control de calidad del software durante todo el proceso, para la especificación de la arquitectura de información, la construcción de funcionalidades y la codificación del libro digital.
Por lo tanto, existen factores que afectan a la edición o al entorno en el cual se desarrolla el libro digital para que se asegure su preservación:
El software: que considera desde el producto o libro digital, hasta las herramientas utilizadas durante la edición.
Los procedimientos o acciones del proceso editorial.
Las reglas de negocio: que incluyen desde el control de calidad del contenido intelectual, hasta la calidad del software.
Los recursos humanos: Es necesario contar con personal calificado con habilidades para el desarrollo de software.
La documentación asociada: Implica la creación de metadatos generados durante el proceso editorial, que se definen a partir de los atributos de calidad del software.
En conclusión, con el modelo presentado es posible que tanto los editores como las entidades encargadas del resguardo de libros digitales visualicen cuál es el alcance que tiene la edición del libro digital y, así, promuevan y preparen los metadatos básicos para preservación.