Índice
Instalar com Pip
pip install Spire.PDF
Links Relacionados
A principal vantagem dos arquivos PDF é a capacidade de manter sempre o formato e o layout do documento original, o que os torna ideais para compartilhamento e impressão. No entanto, muitas vezes são difíceis de editar ou modificar sem software especializado. Nesse caso, a conversão de PDF em Word oferece maior flexibilidade. Com esta conversão, você pode facilmente fazer várias alterações no conteúdo do documento, como modificar o texto, adicionar ou excluir texto e ajustar a formatação e os estilos para atender às suas necessidades. Neste artigo, mostrarei uma maneira simples, mas eficaz de converter PDF para Word via Python.
- Biblioteca Python para conversão de PDF
- Converter PDF em DOC
- Converter PDF em DOCX
- Definir propriedades do documento na conversão
- Obtenha uma licença gratuita para a biblioteca
Biblioteca Python para conversão de PDF
Spire.PDF for Python é uma poderosa API de manipulação de PDF que permite criar, modificar ou converter arquivos PDF em plataformas Python. Com ele, você pode usar o código Python para converter PDF em Word sem esforço e definir as propriedades do documento durante a conversão. Antes disso, instale o Spire.PDF for Python e plum-dispatch v1.7.4 usando os seguintes comandos pip.
pip install Spire.PDF
Este artigo cobre mais detalhes da instalação: Como instalar o Spire.PDF for Python no VS Code
Converter PDF em DOC em Python
Se você deseja editar o conteúdo de um PDF, convertê-lo primeiro para o formato Word é uma boa escolha. Veja a conversão de PDF para DOC como exemplo. Você só precisa carregar o PDF e salvá-lo em formato DOC no local desejado.
Passos
- Importe os módulos de biblioteca necessários.
- Crie um objeto PdfDocument.
- Use o método PdfDocument.LoadFromFile() para carregar um arquivo PDF do caminho especificado.
- Chame o método PdfDocument.SaveToFile() para salvar o PDF no formato Word, especificando FileFormat como DOC.
- Feche o objeto PdfDocument.
Código de amostra
- Python
from spire.pdf.common import *
from spire.pdf import *
# Create a PdfDocument object
pdf = PdfDocument()
# Load a PDF file from the specified path
pdf.LoadFromFile("C:/Users/Administrator/Desktop/Sample.pdf")
# Save the PDF in DOC format
pdf.SaveToFile("C:/Users/Administrator/Desktop/ToDoc.doc", FileFormat.DOC)
# Close the PdfDocument object
pdf.Close()

Converter PDF em DOCX em Python
Este método é igual ao anterior. Você só precisa especificar o formato como DOCX ao salvar o arquivo gerado no final.
Passos
- Importe os módulos de biblioteca necessários.
- Crie um objeto PdfDocument.
- Use o método PdfDocument.LoadFromFile() para carregar um arquivo PDF do caminho especificado.
- Chame o método PdfDocument.SaveToFile() para salvar o PDF no formato Word, especificando FileFormat como DOCX.
- Feche o objeto PdfDocument.
Código de amostra
- Python
from spire.pdf.common import *
from spire.pdf import *
# Create a PdfDocument object
pdf = PdfDocument()
# Load a PDF file from the specified path
pdf.LoadFromFile("C:/Users/Administrator/Desktop/Sample.pdf")
# Save the PDF in DOCX format
pdf.SaveToFile("C:/Users/Administrator/Desktop/ToDocx.docx", FileFormat.DOCX)
# Close the PdfDocument object
pdf.Close()

Definir propriedades do documento na conversão em Python
Além das conversões regulares, você também pode personalizar as propriedades do documento durante a conversão de PDF para Word. Isso pode ajudá-lo a categorizar e gerenciar melhor seus documentos.
Passos
- Importe os módulos de biblioteca necessários.
- Crie um objeto PdfToDocConverter e passe como parâmetro o caminho do arquivo PDF a ser convertido.
- Personalize as propriedades do documento Word convertido por meio das propriedades da classe PdfToDocConverter.
- Chame o método PdfToDocConverter.SaveToDocx() para salvar o PDF no formato Word.
Código de amostra
- Python
from spire.pdf.common import *
from spire.pdf import *
# Create a PdfToDocConverter object
converter = PdfToDocConverter("C:/Users/Administrator/Desktop/Sample.pdf")
# Customize the properties for the file
converter.DocxOptions.Title = "World Environment Day"
converter.DocxOptions.Subject = "Promoting Sustainable Actions for a Greener Future."
converter.DocxOptions.Tags = "Environmental Protection"
converter.DocxOptions.Categories = "Environment"
converter.DocxOptions.Commments = "This is an article about environmental protection."
converter.DocxOptions.Authors = "Mark"
converter.DocxOptions.LastSavedBy = "Johnny"
converter.DocxOptions.Revision = 5
converter.DocxOptions.Version = "V4.0"
converter.DocxOptions.ProgramName = "Green Development"
converter.DocxOptions.Company = "New Technology"
converter.DocxOptions.Manager = "Andy"
# Save the PDF in DOCX format
converter.SaveToDocx("C:/Users/Administrator/Desktop/SetProperties.docx")

Obtenha uma licença gratuita da biblioteca para converter arquivos PDF
Você pode obter um licença temporária gratuita de 30 dias do Spire.PDF for Python para usar o script Python para converter PDF em Word sem qualquer limitação de avaliação.
Conclusão
Neste artigo, você aprendeu como converter facilmente PDF em Word com Python. Com a biblioteca Spire.PDF for Python , você também pode criar PDF do zero ou editá-lo conforme necessário. Resumindo, esta biblioteca simplifica o processo e permite que os desenvolvedores se concentrem na criação de aplicativos poderosos que executam tarefas de manipulação de PDF.