Dise�an un sistema de transcripci�n para documentos antiguos
State permite el ahorro de hasta un 50% del tiempo invertido en la transcripci�n y correcci�n de textos antiguos o manuscritos en funci�n de la tasa de error que ofrezca el Reconocedor �ptico de Caracteres (ROC).
Sistema State en uso mediante un l�piz electr�nico Imagen: Youtube
Tamaño:
Agilizar la recuperación y preservación de los documentos antiguos y manuscritos que forman parte del patrimonio cultural es uno de los objetivos del sistema de transcripción asistida para texto escrito, State, desarrollado por el grupo de investigación de percepción y aprendizaje computacionales del departamento de Lenguajes y Sistemas Informáticos de la Universitat Jaume I en colaboración con investigadores de la Universidad Politécnica de Valencia.
Frente a los tradicionales reconocedores ópticos de caracteres que generan problemas en la transcripción y ofrecen resultados con numerosas erratas que el editor debe corregir, State se presenta como un sistema de transcripción que integra diferentes herramientas que permiten el procesado de imágenes para eliminar ruido y limpiar la imagen original, la detección de la estructura de la página, el reconocimiento del texto y la corrección rápida y cómoda de los errores con herramientas interactivas como un lápiz electrónico aplicado directamente sobre el texto. “Se trata de una solución práctica al problema de transcripción supervisada que permite aligerar la fase más intensiva en tiempo, que es la edición de la transcripción automática para que ésta sea realmente fiel al original” explica Andrés Marzal, uno de los investigadores del proyecto.
De esta manera, State permite el ahorro de hasta un 50% del tiempo invertido en la transcripción y corrección de textos antiguos o manuscritos en función de la tasa de error que ofrezca el Reconocedor Óptico de Caracteres (ROC) utilizado, lo que supone muchas horas en el caso de la digitalización de grandes fondos documentales. Una de las aportaciones del proyecto State es la arquitectura del sistema: el motor de reconocimiento se ejecuta en una máquina diferente a la de los usuarios, que se conectan a ella simultáneamente a través de Internet y acceden al reconocedor vía servicio web al que se suscriben para obtener transcripciones bajo demanda. Otra de las ventajas del nuevo sistema es la utilización de un servidor adaptativo, es decir, que aprende de los ejemplos. Así, una forma de trabajo natural es que lo que uno de los transcriptores considera que merece la pena ser aprendido se envía al servidor, que puede producir una versión mejorada del ROC que pasa a estar inmediatamente disponible para el resto de usuarios.
Soft MP3 Cat�logo en l�nea de venta de programas de computaci�n, m�sica, MP3 y CD Idioma: Espa�ol / Spanish; Castilian
Soluci�n Inform�tica a Medida (SIAM) Programas de gesti�n comercial, para el sector del transporte, telefon�a m�vil, hosteler�a, fundaciones y notar�a entre otros Idioma: Espa�ol / Spanish; Castilian
TuSoftware.com Programas y libros de ingenier�a de procesos, ambiente, mec�nica, qu�mica, civil, estructuras, instrumentaci�n y control Idioma: Espa�ol / Spanish; Castilian
2025 Ciencia1.com - Ciencia y Tecnolog�a. Permitida la reproducción siempre que se señale la fuente y enlace correspondiente a cada material info@ciencia1.com