Muchos no lo sabrán, pero las siglas OCR corresponden a Optical Charater Recognition, o lo que es lo mismo, reconocimiento óptico de caracteres, con lo que podemos escanear alguna hoja y convertir a texto lo que está allí. Es procedimiento es excelente para negocios de esos, que ofrecen servicio de transcripción y elaboración de trabajos en computadora. Y en el caso de este artículo hablaremos sobre Free OCR, una herramienta web bastante bien elaborada.
Free OCR es un servicio web totalmente gratuito que le da al usuario la capacidad de extraer texto de imágenes. El servicio no requiere de registro alguno ni que el usuario de su dirección de correo electrónico. Los idiomas que soporta el servicio son: español, inglés, catalán, ruso, serbio, eslovaco, greco, alemán, portugués, polaco, romano, sueco, turco, húngaro, francés.
Ahora bien, en cuanto a los formatos compatibles con Free OCR tenemos: JPEG, GIF, TIFF, BMP y PDF (en este caso, sólo opera con la primera página del documento PDF). Por ahora, veo que el servicio está disponible solamente en inglés, pero no te preocupes que su proceso de uso es bastante sencillo, consta de simples pasos, los que menciono en la siguiente lista:
- Selecciona el archivo de la imagen que quieres extraer el texto
- Establece el idioma del texto incluido en dicha imagen
- Ingresa el código captcha para contribuir a la evitación del spam
- Has clic en el botón “Send file” y espera a que realice su operación
- Una vez finalizado, te mostrará el texto contenido en la imagen
Realmente el margen de error de Free OCR dependerá enormemente de la calidad que tiene el texto que se incluye en la imagen, por lo que debo comentar que no hace magia alguna. En pocas palabras, es una excelente forma de convertir el texto de las imágenes a “texto plano”.
Enlace web | Free OCR
No hay comentarios:
Publicar un comentario