Digitalización

digitalizacion

Unas de las grandes problemáticas a las que se enfrentan las empresas es al manejo de su información interna o externa. El asunto se torna mucho más complicado si dicha institución lleva varios años de operación, pues es casi seguro que la acumulación de cajas de su archivo muerto es considerable. Esto sumado a toda la papelería que se genera día con día vuelve problemático el manejo de información, llegando a causar omisiones, retrasos o pérdidas considerables.

Debido a estos inconvenientes se desarrolló un sistema accesible capaz de otorgar un mejor manejo y almacenamiento de la información que se genera en formato impreso de una asociación o empresa de cualquier tipo. A este novedoso método se le conoce como digitalización de archivos.

El proceso tiene sus orígenes a finales de los años cuarenta,  como consecuencia del trabajo seminal de Claude Shannon en el desarrollo de una teoría de la información y compresión de datos. Por otro lado, en la Universidad de California, las aplicaciones de digitalización de escritos impresos inician hasta 1991 de manera que, desde entonces, haciendo uso del scanner se almacena archivos de textos como imagen. Y cada vez los avances en esta materia se dan en tiempos cortos y con sistemas increíblemente sofisticados que permiten mantener los archivos digitales con mucha seguridad, con bajo peso y altísima calidad a la vez.

La digitalización de documentos impresos se ha convertido en una de las herramientas más importantes para crear un flujo de información mucho más abierto y está fuertemente relacionado con el fenómeno de globalización del mundo moderno desde que las vías de comunicación revolucionaron la tecnología de la información. Grandes corporaciones como Google o algunas instituciones educativas han comenzado a digitalizar recursos impresos con dos propósitos relevantes: el primero tiene que ver con la conservación de la información y el segundo con la accesibilidad de los mismos recursos.

Como se sabe, el papel impreso tiene una vida finita. Se puede deteriorar fácilmente a causa del paso del tiempo, un mal almacenamiento o por degradación temporal en la calidad del papel. Sin embargo, gracias a la digitalización de estos archivos, es posible preservar documentos sumamente importantes para una organización específica o para la humanidad en su totalidad. Las universidades son los principales usuarios de este tipo de sistemas y justo persiguen el fin de preservar todo el conocimiento e investigaciones generadas antes de la llegada de la computadora moderna.

El segundo propósito es el de volver mucho más accesible la información de cierto organismo o libro. Incluso si se trata de la información histórica de una empresa y que por lo tanto compete a un grupo reducido de personas, la accesibilidad que ellos tendrán de estos datos previos va a ser mucho más fácil si en lugar de un archivo físico, todo aparece en un fichero digital que se sube a la nube y cualquier miembro de la red de trabajo puede acceder a él en cualquier momento que lo necesite.

Es importante que si una empresa está considerando comenzar la implementación de un sistema digital de archivo tome en cuenta diversos dispositivos de almacenamiento y sólo destruya sus archivos físicos en casos sumamente necesarios. Aunque en teoría el archivo generado en la digitalización es infinito y fácilmente reproducible, todos los dispositivos de almacenamiento tienen una límite de vida útil, por lo que al contar con diversos backups o copias de seguridad en distintos equipos (una memoria USB, una computadora o cualquier aplicación de almacenamiento en la nube) va a garantizar la protección duradera de su información.

Después de exponer brevemente en qué consiste el servicio de digitalización de un archivo, ahora vamos a tratar un poco sobre los formatos que generan la digitalización de documentos, y cuáles son los usos que se puede dar a cada una de las variaciones existentes.

digitalizacionLa resolución espacial, o como se dice ahora: la “calidad de imagen” se mide en puntos por pulgada. Esta característica está directamente relacionada con los puntos y bits que generan la reproducción de una imagen en el monitor de una computadora o en la pantalla de cualquier dispositivo digital. Es decir, en pocas palabras estamos hablando de los famosos DPI (Dots per Inch, por el nombre que recibe en inglés). Mientras más alta sea la cantidad DPI contenidos en una imagen, mayor será su calidad (porque tiene más puntos y más información en cada pulgada). Esto también va intervenir directamente con el peso del archivo.  Típicamente una resolución regular es de 200 DPI, aunque es recomendable digitalizar a 300 DPI si la finalidad es extraer texto de esas imágenes, de esa manera la aplicación que “lea” será mucho más eficiente.

Antes de decidir la resolución de cada uno de los archivos que van a pasar por el proceso de digitalización es necesario considera cuál va ser el uso que le vamos a dar a cada uno de los escaneos y en que dispositivos se van a trabajar esos archivos, puesto que, entre más alta sea la calidad de la imagen, más difícil va ser enviarla o transmitirla por medios convencionales (como el correo electrónico o mensajes mediante las redes sociales). Incluso se tiene que pensar si los archivos van a estar disponibles para su consulta vía internet, pues si subimos a la plataforma web un archivo muy grande, el sitio que lo tenga almacenado va a tardar mucho tiempo en cargarse y justo uno de los principales valores de la web es la rapidez con que accedemos a la información. Esto es aplicable incluso para las redes internas de las corporaciones privadas, pues se trata de una saturación de datos que no permite el libre flujo de la información.

Para poder solucionar esta problemática, es necesario trabajar de la mano del empleado que realice el trabajo de digitalización. Una solución rápida podría ser, generar distintas resoluciones para cubrir varias áreas de información o de uso. Puede que resulte un poco tardado generar tres o cuatro versiones distintas, pero sin duda, con esta medida, le será mucho más fácil trabajar con el material digital.

Lo mencionado anteriormente se refiere específicamente de archivos de texto, pero cuando se trata de la digitalización de documentos visuales, los procedimientos cambian un poco. En el caso de fotografías o imágenes de formatos grandes los DPI deben ir proporcionales a la aplicación que van a tener y al tamaño de la imagen con la que se está trabajando. Algunos de las resoluciones más comunes son las siguientes: 2400, 4800,12600. Ahora, si esas imágenes se tienen que enviar constantemente por correo electrónico o van a estar disponibles en una página web es importante ajustar su resolución para que no sea imposible manejarlas por estos medios, y no genere la saturación de los servidores de su empresa.

Basados en la experiencia previa que hemos podido obtener en proyectos anteriores, nosotros recomendamos usar resoluciones que van desde los 100 hasta los 600 DPI, esto con el fin de lograr un equilibrio entre calidad de imagen y peso accesible para fines de almacenamiento y de transmisión de la información a otros servidores.  Estas características de resolución y de peso del archivo también están directamente relacionadas con el formato con el que se guarde cada uno de los documentos digitalizados. A continuación le mostramos una lista de los formatos más recurridos y una breve explicación de las características particulares de cada uno de ellos:

  • TIFF GIV. Tiene compresión de Nivel 4 sin pérdida de información y es para archivos en blanco y negro.
  • JPEG. Las características de compresión de este archivo en particular puede generar un poco de pérdida de información y se utiliza para archivos a color. Generalmente este archivo es el más usado cuando se trata de transmitir rápidamente o en internet cierto archivo. Si lo que busca es modificar el archivo mediante software de imagen, este formato es el menos recomendable, justo por la pérdida de información que se genera en la compresión.
  • PDF. Compresión sin pérdida de información, se usa tanto para blanco y negro o color. Este formato tiene muchas variantes que podemos escoger según las necesidades de almacenamiento. Actualmente es uno de los formatos más usados dentro del proceso de digitalización de archivos. Los subformatos disponibles son:

digitalizaciono    PDF/A.  Es un formato para almacenamiento de largo plazo que contiene dentro de su archivo todos los algoritmos, fuentes y demás información para que en un futuro se pueda abrir sin depender de elementos externos.

  • PDF Searchable, o con opción de búsqueda. Esta imagen tiene dentro de sí el texto de la imagen (naturalmente debe haber sido digitalizada y procesada con OCR). De ese modo, cuando abres la imagen puedes buscar una o varias palabras dentro del texto.

Si está interesado en un mayor control al momento de manejar grandes lotes de información o simplemente está buscando mejores alternativas de almacenamiento de sus archivos no dude en optar por la digitalización de sus documentos, en Imaging Center te orientamos para que, basados en las características de sus actividades y de sus documentos, encontremos la forma más útil, ágil y económica para hacer el acceso y cuidado de su información de manera mucho más eficaz.