Software de reconocimiento de palabras

Software de reconocimiento de palabras

Por lo general, cuando se trata de programas para el reconocimiento de texto escaneado (OCR, reconocimiento óptico de caracteres), la mayoría de los usuarios recuerdan un único producto: ABBYY FineReader, que es sin duda el líder entre este tipo de software en Rusia y uno de los líderes en el mundo.

Sin embargo, FineReader no es la única solución de este tipo: existen programas gratuitos para el reconocimiento de textos, servicios en línea para el mismo fin y, además, estas funciones están presentes en algunos programas conocidos que quizá ya tenga instalados en su ordenador. Intentaré escribir sobre todo esto en este artículo. Todos los programas revisados funcionan con Windows 7, 8 y XP.

Índice

    El líder en reconocimiento de texto es ABBYY Finereader

    Acerca de FineReader (pronunciado como Fine Reader) probablemente escuchó la mayoría de ustedes. Este programa es el mejor o uno de los mejores para el reconocimiento de texto de calidad en ruso. El programa es de pago y el precio de la licencia para uso doméstico es de algo menos de 2000 rublos. También puede descargar la versión de prueba de FineReader o utilizar ABBYY Fine Reader Online para el reconocimiento de texto en línea (puede reconocer varias páginas de forma gratuita, y luego hay que pagar). Todo esto está disponible en el sitio web oficial del desarrollador http://www.abbyy.ru.

    La instalación de la versión de prueba de FineReader no causó ningún problema. El software puede integrarse con Microsoft Office y el Explorador de Windows para facilitar la ejecución del reconocimiento. Las limitaciones de la prueba gratuita son 15 días de uso y la posibilidad de reconocer no más de 50 páginas.

    Como no tengo escáner, utilicé una foto de una cámara de teléfono de mala calidad para probarlo, en la que edité un poco el contraste. La calidad no es ni mucho menos buena, a ver quién puede con ella.

    FineReader puede recuperar una imagen gráfica de texto directamente desde un escáner, desde archivos gráficos o desde una cámara. En mi caso, bastó con abrir el archivo de imagen. El resultado me ha gustado: sólo un par de errores. Debo decir de inmediato que este es el mejor resultado de todos los programas probados cuando se trabaja con esta muestra - una calidad similar de reconocimiento fue sólo en el servicio gratuito en línea Free Online OCR (pero en esta revisión hablamos sólo de las herramientas de software, no de reconocimiento en línea).

    Francamente, para los textos en cirílico, FineReader probablemente no tenga competidores. No sólo la tasa de reconocimiento de texto, sino también su amplia funcionalidad, soporte de formato, exportación competente a muchos formatos, incluyendo Word docx, pdf y otras opciones son las ventajas del programa. Por lo tanto, si las tareas de OCR son lo que enfrenta todo el tiempo, entonces no escatime una cantidad relativamente pequeña de dinero y valdrá la pena: ahorrará una enorme cantidad de tiempo al obtener resultados rápidos y de alta calidad en FineReader. Por cierto, no estoy haciendo publicidad de nada; realmente creo que quienes necesiten reconocer más de una docena de páginas deberían pensar en comprar ese software.

    CuneiForm - software gratuito de reconocimiento de texto

    En mi opinión, el segundo software de OCR más popular en Rusia es el gratuito CuneiForm, que se puede descargar del sitio web oficial http://cognitiveforms.ru/products/cuneiform/.

    La instalación del programa es también muy simple, no hay software de terceros (como muchos programas gratuitos) que no trata de instalar. La interfaz es lacónica y clara. En algunos casos, lo más fácil es utilizar el asistente, para el que está diseñado el primero de los iconos del menú.

    Con la muestra que utilicé en FineReader, el programa falló o, más exactamente, produjo algo poco legible y restos de palabras. El segundo intento se hizo con una captura de pantalla del texto del sitio del programa que tuvo que ser ampliada (necesitaba escaneos de 200dpi y mayor resolución, no podía leer capturas de pantalla con un ancho de línea de 1-2 píxeles). Aquí lo hizo bien (parte del texto no se reconoce, porque sólo se seleccionó el idioma ruso).

    Por lo tanto, podemos suponer que CuneiForm es algo que hay que probar, especialmente si tiene páginas escaneadas de calidad y quiere reconocerlas de forma gratuita.

    Microsoft OneNote - un programa que quizás ya tengas

    Microsoft Office, desde la versión 2007 hasta la actual, 2013, incluye un programa para tomar notas, OneNote. También tiene funciones de reconocimiento de texto. Para aprovecharla, basta con insertar una imagen escaneada o cualquier otro texto en una nota, hacer clic con el botón derecho del ratón sobre ella y utilizar el menú contextual. Tenga en cuenta que la configuración por defecto para el reconocimiento es el inglés.

    No puedo decir que el texto se reconozca perfectamente, pero por lo que veo, algo mejor incluso que en CuneiForm. Lo bueno del programa, como ya se ha mencionado, es que no es improbable que ya esté instalado en tu ordenador. Aunque, por supuesto, si necesitas trabajar con muchos documentos escaneados es poco probable que sea útil, pero puede ser bueno para un reconocimiento rápido de tarjetas de visita.

    OmniPage Ultimate, OmniPage 18: debe ser algo muy interesante.

    No sé qué tan bueno es el software de reconocimiento de texto OmniPage: no hay versiones de prueba, no quiero descargarlo en algún lugar. Pero, si su precio está justificado, y costará unos 5000 rublos en la versión para uso individual y no Ultimate, debería ser algo impresionante. Página del programa: http://www.nuance.com/for-individuals/by-product/omnipage/index.htm

    Si se leen las especificaciones y las reseñas, incluidas las de las publicaciones en ruso, señalan que OmniPage ofrece un reconocimiento de gran calidad y precisión, incluso en ruso, es relativamente fácil de analizar, incluso en los escaneos de mayor calidad, y ofrece un conjunto de herramientas adicionales. Las desventajas son que la interfaz no es la más conveniente, especialmente para los usuarios novatos. De todos modos, OmniPage es un competidor directo de FineReader en el mercado occidental y compiten entre sí en las clasificaciones de inglés, por lo que creo que el programa debería ser digno.

    No se trata de todos los programas de este tipo, también hay diversas variantes de pequeños programas gratuitos, pero mientras experimentaba con ellos encontré dos inconvenientes principales inherentes a ellos: la falta de soporte del cirílico, o un software diferente y no demasiado útil en el kit de instalación, por lo que decidí no mencionarlos aquí.

    Subir

    Si continuas utilizando este sitio aceptas el uso de cookies. Más Información


    Parada Creativa