it-swarm-pt.tech

Como faço para salvar uma imagem PDF como uma imagem?

Eu tenho um PDF que contém uma imagem digitalizada de um documento. Eu quero salvar o conteúdo deste PDF como uma imagem para que eu possa executá-lo através de um programa de OCR que aceita apenas arquivos de tipo .jpg, .png e .gif.

Como faço para salvar/converter este PDF em um desses formatos de imagem?

EDIT: Uma maneira que eu encontrei para fazer isso é clicar em cada página. Copiar para área de transferência. Cole no Paint.net e salve. No entanto, isso é complicado, pois parece que você só pode selecionar uma página por vez no Acrobat Reader.

33
Guy

Por favor, preste muita atenção em resposta do pooryorick , em que ele aponta como resposta do sleske é realmente uma resposta muito melhor para este problema em particular.


Use GhostScript . Este comando funciona para mim:

gs -dBATCH -dNOPAUSE -sDEVICE=png16m -dGraphicsAlphaBits=4 -dTextAlphaBits=4 -r150 -sOutputFile=output%d.png input.pdf

Existem vários pseudo-dispositivos png, que diferenciam a profundidade de cor: pngmono, pnggray, png16, png256, png16m e pngalpha. Escolha o que melhor lhe convier.

Você também pode usar o jpeg, mas, a menos que tenha um problema de espaço em disco, você deseja obter uma qualidade tão alta quanto possível para o seu OCR, e isso não é um jpeg.

O GhostScript não tem mais suporte para gif, mas não consigo imaginar por que você precisaria disso, com o suporte do png256.

20
wfaulk

Instale Imagemagick . Abra uma janela ou terminal cmd:

convert myfile.pdf myfile.jpg

A saída será 1 arquivo jpg para cada página em seu pdf, teste-0.jpg, teste-1.jpg, etc.

19
DaveParillo

Há também pdfimages do ferramentas Xpdf (disponível no site do XpdfReader ). Ele não converterá uma página inteiraPDF em uma imagem, mas sim extrair imagens incorporadas de um PDF.

Isso é útil se o PDF contiver texto e imagens e você quiser apenas as imagens. Além disso, irá extrair as imagens no seu formato original, pelo que não há perda de qualidade (ao contrário dos programas que processam a página inteira e depois a convertem para, por exemplo, JPEG). Dependendo de suas necessidades, isso pode ser útil.


Uso simples:

pdfimages -j -list mydocument.pdf mydocument-images

Isto irá ler o arquivo de entrada mydocument.pdf, extrair todas as imagens e gravá-las em arquivos individuais chamados mydocument-images-0000.jpg, mydocument-images-0001.jpg etc.

A opção -j faz com que ela grave imagens compactadas JPEG compactadas como arquivos JPEG, não como arquivos PBM/PGM/PPM (que são descompactados e grandes). Observe que as imagens ainda podem ser gravadas como arquivos PBM/PGM/PPM, se é assim que foram armazenadas no arquivo de entrada PDF.

13
sleske

Você pode fazer isso usando o Adobe Reader:

  1. Clique na imagem. Será destacado.
  2. Copie (Ctrl-C) e cole no Paint.
  3. Salvar como qualquer tipo de arquivo que você gosta.
11
Hemant

Com exceção da resposta que menciona as imagens em pdf, todas as outras respostas não mencionam que suas soluções realmente transcodificam as imagens incorporadas. Ou seja, essas soluções não simplesmente extraem a imagem original, mas a modificam, possivelmente em detrimento da imagem, durante o processo. Somente pdfimages extrai a imagem original. Isso é verdade para o Ghostscript, o Imagemagick, o Adobe Reader, o PDFFill, PDF o Xchange Viewer, o OS X Preview e a maioria dos outros PDF software.

9
pooryorick

PDFill PDF Ferramentas é provavelmente a maneira mais fácil de converter seus PDFs em imagens no Windows. Ele permitirá que você exporte todas as páginas do PDF para separar as imagens de uma só vez. Ele também tem muitos outros recursos disponíveis gratuitamente, que só estão disponíveis em outros visualizadores PDF se você comprar a versão comercial ou "Pro".

Use o botão "Converter PDF para imagens" (botão # 10) na imagem abaixo.

PDFill PDF Tools screenshot

Se você precisar concatenar as imagens em uma imagem muito alta, basta alimentar apenas um arquivo em seu programa de OCR. Você pode usar IrfanView

4
rob

Como você não incluiu uma tag do SO, incluirei uma resposta do OSX:

Por padrão, PDFs abrem em Preview.app, que permite usar File -> Save-As:

  • GIF
  • ICNS
  • JPEG
  • JPEG-2000
  • BMP
  • OpenEXR
  • Photoshop
  • PNG
  • TGA
  • TIFF
2
Lake

Também PDF Xchange Viewer (Free) exportará para o arquivo. Arquivo → Exportar → Exportar para imagem.

Não só isso, mas eu acho que é o melhor visualizador gratuito PDF para Windows, e tem alguns recursos de marcação Nice. Eu tenho uma licença para o Adobe Acrobat e ainda prefiro isso, a menos que eu esteja fazendo uma edição extensiva, o que raramente acontece.

1
wfaulk

(Não-livre) O Acrobat Professional faz isso:

Avançado-> Processamento de Documentos-> Exportar todas as imagens ...

1
ufotds

Se o arquivo tiver menos de 5 MB e você não estiver preocupado com privacidade/confidencialidade, então é um serviço online prático em http://www.go2convert.com/ que pode fazer muitas conversões gráficas (incluindo pdf para jpeg)

0
sgmoore