sábado, 8 de febrero de 2014

Modifica documentos PDF y archivos de imagen. (Tambien directos del Escaner)

Hola de nuevo!!!

Quería hablaros de un programa que sirve para como dice el titulo, modificar archivos PDF o de imagen.
El funcionamiento es bastante sencillo, al menos, una vez que te explican lo más básico, así que esa es mi intención, intentar explicar un poquitín como chuta este programa.
Venga, vamos al lío, el programa en cuestión se llama OCRFeeder, y como viene siendo habitual, lo instalaremos desde el Synaptic o al que prefiera desde la terminal pues ya sabe, como siempre:

sudo apt-get install ocrfeeder

*desde el synaptic si no se han marcado, marcad vosotros mismos estos dos paquetes: tesseract-ocr-spa y ocrad. (yo personalmente utilizo tesseract), pero bueno, eso ya es cosa de cada uno.


Ale!!! ya está instalado y nos lo vamos a encontrar en nuestro menú de oficina.
Ahora vamos a empezar a usarlo, imaginaos que lo que queremos es modificar un archivo que ya tenemos guardado en PDF.
Mira tu por donde tengo aquí uno, el trabajo de la hija de una amiga para el instituto, espero que le den por lo menos un notable a la chavala y encima me va a venir bien para usarlo como ejemplo, porque vereis que está escrito en catalán y mira tu por donde voy a "traducirlo" a mi manera, (no te enfades conmigo frannoe si traduzco alguna burrada, que soy de CAI picha) jejeje.

Venga, vamos al lío, abriremos el programa y nos iremos a la opción Archivo-importar PDF.... y seleccionamos el archivo que queramos modificar, (vereis que hay varias opciones, PDF, IMAGEN, DESDE ESCANER....


Bueno, ya lo tenemos seleccionado y ahora aquí viene el "kit" de la cuestión, ¿como lo modificamos?, para el que ya sepa como va, OLÉ, pero para el que no, intentaré explicarlo lo más sencillo posible.

Pulsamos el botón izquierdo del ratón y seleccionamos la parte que queremos, y una vez marcado se nos abrirá una ventana justo al lado que nos da la opción de marcar si lo queremos como TEXTO o como IMAGEN, bien en este caso como es el titulo del trabajo lo vamos a dejar tal cual, entonces para ello marcaremos la opción de IMAGEN. 


Bueno, ya tenemos el primer paso dado, ahora vamos a modificar el resto de las partes del documento, empezaremos seleccionando la parte del texto que queramos retocar, podéis hacerlo por partes y  luego decidís si queréis que sean como texto o imagen, os pongo algunas capturas de pantalla.


Como podéis ver, la parte que guardaremos como imagen, se queda de color verde, y la parte de texto es la que está de color azul.

Una vez seleccionado todo, muy importante para poder modificarlo es las partes que hemos subrayado como TEXTO, le pulsamos y en la ventana de la derecha, en la parte de abajo, vereis que os pone el motor de ocr que queréis utilizar, ya os comente que yo uso TESSERACT, pero podéis usar el que mejor os vaya, pues justo al lado hay un botón que pone OCR pues ahí es donde debéis de pulsar y vereis como en la ventana de abajo os sale el texto.




Bueno, ya tenemos todo lo que necesitamos, ahora nos iremos a archivo-exportar y seleccionamos el formato al que queramos exportarlo, en este caso lo pasaremos a ODT para poder abrirlo luego con LibreOffice.


Ya está exportado al formato necesario y lo abriremos con LibreOffice.


Una vez abierto empezaremos a escribir, insertar imagenes o lo que nos de la gana de hacer.  Ya varéis que sólo os da la opción de modificar la parte que seleccionasteis como texto, porque las que son como imagenes se quedan tal cual.


Y nada, ya tenemos casi todo el trabajo hecho, ya sólo nos falta si queremos volverlo pasar a PDF pues dale a exportar y listo. El resultado sería lo que veis aquí abajo.



Pues como podéis ver, no ha sido tan complicado, al menos, he intentado hacerlo lo más fácil posible.
Espero os pueda servir de utilidad a alguno, eso sí, para los que tengáis hijos en edad escolar, que se lo curren ellos ehhh, que no hagan los trabajos otros y luego pongan abajo (hecho por mi), con dos cojones.
Un saludo a todo el mundo.

 

No hay comentarios:

Publicar un comentario