Python PDF转Word-完美源码

最近更新：2023年12月20日

Python PDF转Word

4.67K

免费优惠信息:免费

暂无演示 QQ咨询

免费售后咨询

特别声明：原创产品提供以上服务，破解产品仅供参考学习，不提供售后服务（均已杀毒检测），如有需求，建议购买正版！如果源码侵犯了您的利益请留言告知！如何获得积分

正文

命令行核心代码：



from pdf2docx import Converter
def convert_pdf_to_docx(pdf_file_path, docx_file_path):
    # 将PDF转换为Word
    cv = Converter(pdf_file_path)
    cv.convert(docx_file_path, start=0, end=None)
    cv.close()
if __name__ == "__main__":
    # 输入PDF文件路径和输出Word文件路径
    pdf_file_path = '考评报告书--高等学校.pdf'
    docx_file_path = '考评报告书--高等学校.docx'
    # 执行转换
    convert_pdf_to_docx(pdf_file_path, docx_file_path)
    print(f"转换完成，生成的Word文件保存在：{docx_file_path}")

在命令行的基础上增加了GUI



import tkinter as tk
from tkinter import filedialog
from pdf2docx import Converter
import os
def convert_pdf_to_docx(pdf_file_path):
    # 获取 PDF 文件名（不带扩展名）
    pdf_file_name = os.path.splitext(os.path.basename(pdf_file_path))[0]

    # 设置输出的 Word 文件名
    docx_file_path = f"{pdf_file_name}.docx"
    # 将PDF转换为Word
    cv = Converter(pdf_file_path)
    cv.convert(docx_file_path, start=0, end=None)
    cv.close()
    return docx_file_path
def browse_pdf():
    global pdf_file_path
    pdf_file_path = filedialog.askopenfilename(title="选择PDF文件", filetypes=[("PDF files", "*.pdf")])
    pdf_label.config(text=f"选择的PDF文件: {pdf_file_path}")
def convert_and_save():
    if pdf_file_path:
        # 调用转换函数
        docx_file_path = convert_pdf_to_docx(pdf_file_path)
        result_label.config(text=f"转换完成，生成的Word文件保存在：{docx_file_path}")
    else:
        result_label.config(text="请先选择PDF文件")
# 创建主窗口
root = tk.Tk()
root.title("PDF to Word Converter")
# 设置窗口宽度和高度
window_width = 400
window_height = 300
# 获取屏幕宽度和高度
screen_width = root.winfo_screenwidth()
screen_height = root.winfo_screenheight()
# 计算窗口左上角坐标使其居中
x_position = (screen_width - window_width) // 2
y_position = (screen_height - window_height) // 2
# 设置窗口大小和位置
root.geometry(f"{window_width}x{window_height}+{x_position}+{y_position}")
# 选择PDF文件按钮
browse_button = tk.Button(root, text="选择PDF文件", command=browse_pdf)
browse_button.pack(pady=10)
# 显示选择的PDF文件路径
pdf_label = tk.Label(root, text="选择的PDF文件: ")
pdf_label.pack()
# 转换按钮
convert_button = tk.Button(root, text="转换为Word", command=convert_and_save)
convert_button.pack(pady=10)
# 显示转换结果
result_label = tk.Label(root, text="")
result_label.pack()
# 在窗口底部添加 "Development by 都百顺" 横向居中显示
developer_label = tk.Label(root, text="Development by 都百顺（抖音号：dubaishun12）")
developer_label.pack(side="bottom", pady=10)
# 运行主循环
root.mainloop()

上面下载是生成好的 .exe文件

下面这份代码来源于网上，转换效果不好，只能转换成文字，不能把换行和表格转换出来。



import PyPDF2
from docx import Document
def clean_text(text):
    # 将文本限制为XML兼容的字符
    return ''.join(c for c in text if c.isprintable())
# 打开PDF文件
pdf_file = open('考评报告书--高等学校.pdf', 'rb')
# 创建一个PDF读取器对象
pdf_reader = PyPDF2.PdfReader(pdf_file)
# 创建一个Word文档对象
doc = Document()
# 读取PDF文件中的每一页，并将其转换为Word文档中的段落
for page_num in range(len(pdf_reader.pages)):
    page = pdf_reader.pages[page_num]
    text = page.extract_text()
    cleaned_text = clean_text(text)
    doc.add_paragraph(cleaned_text)
# 保存Word文档
doc.save('考评报告书--高等学校.docx')
# 关闭PDF文件和Word文档对象
pdf_file.close()

END

如本资源侵犯了您的权益，请联系投诉邮箱admin@wmphp.com进行举报！我们将在收到邮件的1个小时内处理完毕。本站仅为平台，发布的资源均为用户投稿或转载！所有资源仅供参考学习使用，请在下载后的24小时内删除，禁止商用！ Wmphp.com（完美源码）助力正版，如您有自己的原创产品，可以联系客服投稿，代理出售！ Wmphp.com（完美源码）客服QQ：136882447 Wmphp.com（完美源码）商务电话（仅对企业客户/个人用户）：15120086569 （微信同步）请注意：本站不提供任何免费的技术咨询服务，为了节约时间，下载前请确认自己会技术
完美源码 » Python PDF转Word