digitalización

Nunca es la última

Hay una empresa en Milán llamada Leonardo 3 que parece vivir exclusivamente de la obra de Da Vinci; hacen exposiciones, estudios, etc. Tienen en el sitio una buena presentación cronológica de todas las obras atribuidas a Leonardo, con indicación de la escala humana y el momento de la vida del artista en el que fue creada cada una.

Pues anuncian que han producido una (otra, otra) reconstrucción digital de la Última Cena, y esto es una ocasión que no se puede dejar pasar para contrastar lo que queda de la pintura y lo supuestamente pudiera haber pintado Leonardo. Imágenes: original, reconstrucción, con un pequeño ajuste en escala.

| Imagen 1 de 2 |
La obra cambia según el fotógrafo, esta es una de las versiones

Evidentemente, la degradación del fresco original va a seguir permitiendo que se le den muchas vueltas...

Mundo digital

A estas alturas ya todo el mundo sabe de la reciente apertura de la Biblioteca Digital Mundial (WDL) realizada con apoyo de UNESCO y que hasta el momento contiene reproducciones digitales de cerca de 1200 objetos. La WDL es realmente una compilación de los fondos digitales de unas veintipico instituciones, su novedad consiste en el hecho de ponerlos a disposición del navegante de una manera estructurada, se puede revisar por época, región geográfica, tipo de objeto o institución.

Para probar, he buscado entre los 320 disponibles en el área 'América Latina y el Caribe', el artefacto más antiguo, que resulta ser esta cajita de ofrendas ¡de madera! y que además de la imagen de su propietario tiene 41 jeroglifos que no sólo cuentan sobre las circunstancias de su elaboración, también dice la fecha exacta: 14 de octubre de 681 (¿no es una maravilla para los autenticadores de piezas antiguas?).

Cajita

El segundo objeto según la antigüedad es este jaguar (balam) humanoide de cerámica cuyo autor no tuvo la delicadeza de ponerle fecha, por lo tanto se supone que pertenece a algún momento entre los siglos VII y X y que -dicen- debe haber flanqueado el trono de algún político maya. No me queda clara la función del collarín.

Balam-jaguar

Digitalización: avances

Como conté hace unos días, estoy embarcado en un proceso absorbente de digitalización de diapositivas. La práctica hace al maestro, dicen; sigo practicando pero falta mucho para que me den la maestría. Me parece conveniente para efectos divulgativos echar el cuento de las condiciones de trabajo y eficiencia o productividad que he alcanzado.

Equipo digitalizador

Una vez instalado el aparataje y adquirido un paso y una metodología, se toman alrededor de 200 fotos por hora. Impresionante, ¿no? Pero no se puede trabajar una hora seguida sino a costa de un dolor de vértebras que se suponían inexistentes. En tramos de 20 minutos se sacan entre 60 y 100 fotografías, digamos, crudas. El equipo digitalizador que estoy utilizando -en la imagen-, consta de cámara (azul); lo imprescindible, un cilindro duplicador (morado) que tiene un lente de acercamiento y un difusor de luz; lámpara (verde oscuro), en este caso un bombillo fluorescente de 20 W, que no es gran cosa, pero funciona; trípode (verde claro) porque todas las fotos son lentas, entre un octavo y un treintavo de segundo, también porque utilizo una abertura de 13 a 16, para garantizar lo más que se pueda el enfoque.

Otras cosas: anillos adaptadores (marrón), cajas para asegurar que el peso no mueva el armatoste fotográfico, y finalmente, prescindible pero muy útil, una mesa de luz (amarillo) en este caso suministrada en calidad de préstamo, que es muy práctica para ordenar y elegir las diapositivas que van a "sufrir" el proceso.

Lo que consume tiempo es el "post-proceso"; implica en muchos casos rotar la foto y siempre hacer recortes. Después, un ajuste automático de niveles que produce una mejora sustancial, pero debe afinarse con balance de blancos ocular (esto es: a ojo). Si se quiere derrochar tiempo, también se pueden eliminar marcas, hongos, etc. Aquí podemos hablar de unas 30 a 50 imágenes corregidas por hora, y eso a todo tren y sin mucho miramiento.

Como debo presentar algún resultado, aquí va. Unas vistas de Caracas y Maracay en 1997 y otras obtenidas durante un escabroso ascenso a La Silla de Caracas en mayo 1978 y lo que quedó del ascenso al pico Bolívar (La Aguja) en marzo de ese mismo año.

Digitalizar diapositivas

Nadie en su medio sano juicio estará tomando diapositivas en estos tiempos; pero hubo una vez en la que eran la mejor opción para tener imágenes de buena calidad y a un precio asequible. La consecuencia de eso es que quien lo hizo acumuló una cierta cantidad de diapositivas y no sabe qué hacer para que no estropeen más de lo que ya están ni para verlas de vez en cuando, que se supone era el propósito de haberlas tomado. Bueno, ya se entiende por dónde va la cosa: yo soy uno de esos que tiene unas tres mil diapositivas pudriéndose, pero que tiene ganas de recuperarlas. Y hay que tener muchas ganas.

El proceso empieza con las pruebas; al principio uno de iluso utiliza un escáner para que queden bien, pero al llegar a la tercera digitalización ya se nota que ese no es el camino. El escáner, cualquier escáner, es lento y fastidioso. Así que, el siguiente paso es fotografiar las diapositivas. Se puede hacer en forma casi directa, pero los resultados no son adecuados: fallas de nivel, diferencias de luz, enfoque, etc. Así que resulta mejor conseguir un aparato 'ad hoc', llamado duplicador de diapositivas que consiste en un cilindro que se conecta al lente de una cámara (digital, se supone) y que en la punta dispone de un difusor de luz (pieza clave) y algún mecanismo para deslizar las diapositivas.

Eso es nada. Luego hay que buscar una fuente de luz apropiada (¿quién tiene una fuente de luz apropiada?). Lo que tengo a disposición es una lámpara fluorescente; eso implica uso de trípode para la cámara, porque la luz no es precisamente brillante; el conjunto que forma la lámpara, el trípode, los cables que van implícitos y el grupo de diapositivas ocupan un espacio considerable. Al final, se pone uno a fotografiar las fotos, una por una y parece que ya está listo.

Tres versiones rivales de la estéticaPero no. Ahí es cuando empieza el trabajo. Es evidente que las diapositivas serán viejas, por lo tanto en el mejor de los casos sólo han perdido color, pero pueden tener moho, suciedad, insectos ¡quién sabe! Así que al descargar las imágenes al computador viene el asunto de revivir los colores originales y justificar tamaña inversión de esfuerzo. Para resumir, diré que los ajustes automáticos de niveles funcionan bastante bien y logran un resultado que es tolerable. Y es que necesariamente deben usarse ajustes automáticos porque de otro modo en cada imagen se pueden pasar varios días.

Este ejemplo servirá para tener una idea. La imagen superior es la "original", esto es, la descargada directamente de la cámara y es un muy similar a la diapositiva original. Claro que la definición nunca será igual, por el hecho de fotografiar una fotografía la profundidad del color y la precisión de los detalles no es tan buena como lo fue la diapositiva en sus tiempos de esplendor. El borde negro señala también la inadecuación de la orientación, cosa que puede mejorarse algo. Puede notarse aún en esta miniatura cómo la diapositiva tiene un color violeta predominante (se trata de una iglesia en Quito).

Una primera aproximación de ajuste de niveles (hecha con Gimp, aunque Gthumb también lo hace bien) deja un resultado mejor pero con tinte verdoso; mucho rato de experimentación y búsqueda produce la tercera imagen, mejor balanceada (también con un ajuste de perspectiva). El truco está según parece en el balance de blancos. El problema es que el Gimp provee tres herramientas para encontrar el balance apropiado: por punto negro, por punto gris o por punto blanco; y a veces no se consigue en toda la imagen un punto que satisfaga a ninguna de las tres. Por lo que al final ya uno no sabe cuál es el color que estaba buscando ni cuál era el original. Realmente tiene su ciencia (y su arte). El caso es que -si me buscan- estaré digitalizando diapositivas y notificaré su publicación cuando sea el caso.

Texto a voz casi automático, o cómo recitar un libro

Ahora que he hecho el proceso completo al menos una vez, creo estar en condiciones de echar el cuento de cómo producir un audiolibro en GNU/Debian(testing)/Linux. Se supone que disponemos de un libro -o cualquier otro texto- en formato PDF, al final se obtiene un cierto número de archivos mp3 u ogg que pueden escucharse en la computadora o en un tocador portátil de esos formatos.

Los programas requeridos -aparte de las herramientas normales del terminal- son: festival (incluye text2wave y voz en español), pdftotext o ps2text, y lame para producir MP3.

Primero, hay que convertir el archivo PDF a texto y el problema puede estar en la codificación del texto. En esta máquina la codificación predeterminada es iso-8859-1 o Latin1. También puede pasar que la conversión no se pueda realizar porque el conversor no "conoce" la codificación. En ese caso, hay que agregar la línea textEncoding Latin1 en el archivo de configuración de xpdf, en debian está en: /etc/xpdf/xpdfrc. Así que hay dos opciones:

  • pdftotext -enc Latin1 archivo.PDF
  • pstotext -output archivo.txt archivo.pdf

Después de probar ambas, me quedo con la última. ps2text hace un mejor trabajo de conversión del texto a Latin1 (de hecho es lo que hace de forma predeterminada), elimina caracteres ocultos y deja el texto más limpio (por ejemplo, convierte los guiones largos en ---). Este proceso tarda unos pocos segundos.

Pero el conversor de texto a voz comete actualmente algunos errores intolerables, como no entender los signos ¿ (pronuncia "equis" y deletrea la palabra que sigue). Así que hay que pulir el texto, esto es, corregir la ortografía (los acentos y demás detalles son importantes para la pronuciación correcta) y eliminar los caracteres no pronunciables o que causan esos errores en el robot-lector, en el caso que nos ocupa ¿ ¡ - y similares. Para ello se puede hacer un pequeño libreto (script) con sed, como líneas como esta: sed -i -e 's/¿/ /g' archivo.txt. Una vez pulido el texto, ya se puede enviar al lector, pero el resultado sería un solo archivo excesivamente largo si se trata de un libro (unas 300 páginas pueden llevar a 200 megabytes de archivo de sonido y eso en un formato comprimido). Así que es preferible 'picar' o dividir el texto original en trozos para que sea más sencillo detener al lector y llegar a un punto dado.

Para dividir el archivo ya corregido en pedazos de (por ejemplo) 300 líneas: split -l 300 -d archivo.txt prefijo. El 'prefijo' es el nombre que tendrán los archivos divididos seguidos de un número secuencial, por lo tanto esa orden crea una serie de archivos con nombre prefijo01, prefijo02, etc. Si text2wave se confunde con los nombres de los archivos, se les puede agregar la extensión .txt de forma automática así: rename 's/$/\.txt/' prefijo*

Hasta aquí, no se ha producido ningún sonido, aparte del típico repiqueteo del teclado. Ahora hay que ordenarle a text2wave que vaya leyendo cada uno de los archivos text2wave prefijo04.txt -o archivodesonido04.wav. Pero, puede pasar -así fue en este caso- que el lector predeterminado no sea el que queremos. Para hacer que la voz elegida por text2wave para leer sea la que realmente se desea hay que modificar -o crear, si no existe- un archivo llamado .festivalrc y colocar esta línea: (set! voice_default 'voice_el_diphone): la voz "el_diphone" que corresponde a un lector español será la que haga el trabajo; de otro modo muy bien puede suceder que el lector sea un gringo y la lectura será consecuentemente errada.

Además, es preferible hacer de una vez la conversión a un formato portátil, sea MP3 u Ogg, de una de estas formas:

  • text2wave prefijo01.txt | lame - prefijo01.mp3
  • text2wave prefijo01.txt | oggenc - -o prefijo01.ogg

Ya que pueden resultar muchos archivos (entre 10 y 100, dependiendo de la longitud que hayamos decidido poner como norma) es mejor hacer un libreto o script, algo como:


cuenta=1
for i in `ls prefijo*`
do
text2wave $i | lame - prefijo${cuenta}.mp3
cuenta=`expr $cuenta + 1`
done

Lo que queda es esperar un rato; según mi cuenta, aproximadamente una décima parte del tiempo de lectura real. Es decir, si la lectura del libro completo dura unas 30 horas, el proceso de conversión de texto a voz tardará unas tres; de hecho algo menos, dependerá de la velocidad de la máquina y demás detalles.

Suscribirse