it-swarm-pt.tech

Extraindo imagens incorporadas de um PDF

Antes de começar a usar o Ubuntu, eu usei o Nitro PDF reader para extrair imagens automaticamente de arquivos PDF. Existe um PDF reader para Linux que faz isso?

Eu gostaria de ser capaz de extrair imagens mais rápido/fácil do que quando se tira uma foto.

157
1kb

Use pdfimages

pdfimages é uma ferramenta de extração de imagens PDF que salva as imagens em um arquivo PDF em formato PPM, PBM, JPEG ou arquivo JPEG 2000 (s).

É uma parte do pacote poppler-utils, que você precisará instalar.

Uso: pdfimages [options] <PDF-file> <image-root>

Exemplo: O seguinte extrai todas as imagens de um arquivo PDF, salvando-as no formato JPEG.

pdfimages -j in.pdf /tmp/out

Salvará as imagens do arquivo PDF in.pdf nos arquivos /tmp/out-000.jpg (ou /tmp/out-000.pbm; veja abaixo), /tmp/out-001.jpg, etc.


O pdfimages man page explica:

-j:  Normally, all images are written as PBM (for monochrome images) or PPM for
     non-monochrome images) files. With this option,  images in DCT format are
     saved as JPEG files. All non-DCT images are saved in PBM/PPM format as usual.
190
pl1nk

Eu costumo usar o Inkscape para isso. Carregue a página e exclua todas as outras coisas. A vantagem é que você pode obter imagens vetoriais em SVG e modificá-las como quiser.

22
Gremlin

Eu tenho uma coluna dupla PDF arquivo com imagens incorporadas criadas com LaTeX, onde as imagens originais foram fornecidas como EPS. Eu tentei a solução proposta com base em pdfimages, mas, infelizmente, ela não retornou nenhuma imagem. Eu tentei usar o Inkscape, mas as imagens SVG que ele gerava estavam distorcidas e eu também não tive sorte em exportá-las como EPS.

O software que funcionou para nós foi o MasterPdfEditor .

Aqui está o procedimento

  • Abra seu arquivo usando o Master PDF Editor
  • Use a ferramenta de edição (Alt + 1) para selecionar a imagem que você precisa extrair
  • Copie a figura (Ctrl + C)
  • Clique no quadro tracejado ao redor da imagem e confira a barra lateral direita (Inspetor de objetos) e clique em "Geomerty". Lá você pode ver o tamanho da sua seleção
  • Crie um novo arquivo (Ctrl + N). Ele solicitará que você forneça o tamanho da página. Forneça o tamanho exato de sua imagem e crie o novo arquivo
  • Agora é um pouco complicado: cole a imagem (Ctrl + V). A imagem pode não aparecer no novo arquivo. Use as setas para movê-lo até conseguir rastreá-lo.
  • Use as setas para centralizar a imagem na nova página
  • Salvar como PDF

O resultado é de alta qualidade, mas o software não é gratuito. Existe uma versão de demonstração que "permite que você experimente todos os recursos", mas vem com "a adição de uma marca d'água no arquivo de saída". Para ser franco, não notei nenhuma marca d'água no PDF produzido.

5
Pantelis Sopasakis

Você também pode tentar pdfmod. É uma GUI (interface gráfica) que pode extrair imagens e fazer outras manipulações básicas em pdf.

4
To Do

Se você precisar de uma imagem recortada no formato pdf/eps, extraia uma página com a imagem usando pdfmod (como sugerido por To Do).

Em seguida, usando pdfcrop, você pode recortar corretamente as margens de configuração por tentativa e erro:

pdfcrop --margins "-15 -50 0 -140" extracted_page.pdf
2
macieksk

Se você quiser cortar uma imagem de um pdf com um pdfviewer, você pode tentar okular. Pode cortar qualquer coisa (textos ou imagens) em formato png ou jpeg. Se você quiser extrair imagens em formato png de um pdf, você pode fazer isso com o mínimo de comando com o pdftohtml. Converte pdf para html e imagens. Aqui você pode encontrar um exemplo - https://www.youtube.com/watch?v=CG1rf7k3xo8 . Se você quiser extrair muitas imagens de um pdf, sugiro que tente isso.

1
user203413

Eu uso pdfimages que é uma ferramenta de linha de comando e funciona muito bem para mim. É muito fácil de usar e você pode usar a opção --help para aprender mais sobre seu uso. Eu uso o Ubuntu e vem pré-instalado. Se seus arquivos pdf estiverem criptografados ou protegidos por senha, existem opções para isso, portanto, essa ferramenta funciona muito bem. Você pode ler mais sobre pdfimages aqui

1
jetbird13

Com pdfimages, a imagem extraída pode estar em duas ou mais partes. Uma maneira simples de reuni-los novamente sem se preocupar com os formatos extraídos é importar as peças para o LibreOffice Draw, cortar com o diálogo de cortar imagem, posicionar as partes, ajustar o tamanho da página e exportar no formato que preferir.

1
DafyddG

Software utilizado: Xreader OS: Antergos

Passos:

  1. PDF aberto
  2. Clique com o botão direito na imagem
  3. Selecione Salvar imagem como ...
  4. Nome e extensão do arquivo de entrada.
  5. Salve .
0
Yash Krishan Verma