PDFMiner是一個從PDF文檔中提取信息的工具。與其他PDF相關的工具不同,它只用于獲取和分析文本數據。PDFMiner能獲取頁面中文本的準確位置,以及字體或行等其他信息。它還有一個PDF轉換器,可以將PDF文件轉換成其他文本格式(如HTML)。還有一個可擴展的解析器PDF,可以用于文本分析以外的其他用途。
(地址https://github.com/euske/pdfminer)
PyPDF 2是一個python PDF庫,能夠分割、合并、裁剪和轉換PDF文件的頁面。它還可以向PDF文件中添加自定義數據、查看選項和密碼。它可以從PDF檢索文本和元數據,還可以將整個文件合并在一起。
(地址https://github.com/mstamy2/PyPDF2)
ReportLab能快速創建PDF 文檔。經過時間證明的、超好用的開源項目,用于創建復雜的、數據驅動的PDF文檔和自定義矢量圖形。它是免費的,開源的,用Python編寫的。該軟件包每月下載5萬多次,是標準Linux發行版的一部分,嵌入到許多產品中,并被選中為Wikipedia的打印/導出功能提供動力。
(地址https://www.reportlab.com/opensource/)
以上3個Python PDF庫。