Conversión de diferentes formatos de archivo para un análisis de palabras más fácil

Nada es más agradable para un director de proyecto que cuando recibimos un documento de Word (u otro documento de texto plano) para cotizar y trabajar con él. Con muchos programas para determinar el número de palabras de dicho documento, el proceso de cotización se vuelve más rápido, preciso y mucho más fácil cuando está en este tipo de formato de archivo. Pero, por desgracia, la vida laboral no siempre es tan acomodaticia. La mayoría de las veces recibimos archivos.pdf o.jpeg llenos de imágenes, tablas, texto manuscrito, y lo que es peor, copias escaneadas de texto. Dado que no podemos simplemente hacer un recuento de palabras para enviar a nuestros clientes, necesitamos realizar ciertas funciones para averiguarlo. Además, al citar, no sólo debemos determinar cuántas palabras hay en un documento, sino cuántas imágenes, imágenes con encabezados y pies de página de texto, y otras propiedades tan importantes están contenidas en ese documento. Por suerte, tenemos un par de programas que usamos para analizar nuestros archivos. Cuando abrimos un archivo.pdf y vemos que es una copia relativamente bonita (es decir, que el formato de texto es recto y ordenado), todas las letras son perfectamente claras y/o no hay imágenes, utilizamos un programa llamado Solid Converter PDF. Usando este programa, subimos el documento y luego lo convertimos a formato MS Word (también puede convertirlo a texto plano, .rtf y . xml). A partir de ahí, tomamos nuestro archivo y lo ejecutamos a través de Trados, Wordfast o Memsource para determinar un recuento de palabras (en muchos casos, ejecutamos el recuento de palabras a través de al menos dos programas para obtener un análisis preciso). En la mayoría de los casos, sin embargo, recibimos archivos ilegibles, escaneados o llenos de imágenes y tablas. Para ello utilizamos un programa fiable del que no podríamos prescindir los PM y que es el ABBYY FineReader. Esta aplicación especial primero predigitaliza el archivo para usted. A continuación, se revisa cada página del documento y se modifica lo que se ha analizado para la última digitalización/escaneado. ABBYY (como lo llamamos en la oficina) le permite separar texto, imágenes y tablas. Usted simplemente resalta todas las áreas que son diferentes entre sí de acuerdo a lo que son (de nuevo, ya sea texto, imagen o tabla) y hace que el programa “lea” el archivo analizado. Desde allí se procede a las otras páginas haciendo lo mismo hasta que se haya completado el documento! A continuación, ABBYY convierte todo en un archivo de texto para que podamos continuar con el proceso. Con grandes herramientas como esta para obtener resultados más confiables, podemos asegurar que el cliente está obteniendo la cotización más precisa.

1 Star2 Stars3 Stars4 Stars5 Stars (No hay votaciones)
Cargando…