Как найти и заменить текст в PDF
Умение находить и заменять текст в документах PDF — ценный навык, имеющий широкое применение. Будь то профессиональные, академические или личные нужды, эта возможность позволяет пользователям эффективно обновлять информацию, обеспечивать точность, поддерживать соответствие требованиям и оптимизировать различные рабочие процессы.
В этой статье вы узнаете, как заменить текст на странице PDF или во всем PDF-документе с помощью Python.
- Поиск и замена текста на определенной странице PDF
- Найти и заменить текст во всем PDF-документе
Установите зависимость
Это решение требует установки в качестве зависимости Spire.PDF for Python, которая представляет собой библиотеку Python для чтения, создания и работы с PDF-документами в программах на Python. Вы можете установить ее, выполнив следующую команду pip.
pip install Spire.PDF
Поиск и замена текста на определенной странице PDF
С помощью Spire.PDF вы получаете определенную страницу из PDF с помощью метода PdfDocument.Pages.get_Item(), а затем заменяете целевой текст на новый с помощью метода PdfTextReplacer.ReplaceAllText().
from spire.pdf import *
from spire.pdf.common import *
# Create a PdfDocument object
doc = PdfDocument()
# Load a PDF document
doc.LoadFromFile("C:\Users\Administrator\Desktop\Input.pdf")
# Get a specific page
page = doc.Pages.get_Item(0)
# Create an object of PdfTextReplacer class
replacer = PdfTextReplacer(page)
# Replace the target text with new text
replacer.ReplaceAllText("old string«, «new string»)
# Save the document
doc.SaveToFile("ReplaceTextInPage.pdf")
# Dispose resources
doc.Dispose()
Найти и заменить текст во всем PDF-документе
Теперь вы узнали, как заменить текст на определенной странице PDF-документа. Вы перебираете страницы документа с помощью цикла for и заменяете текст на этих страницах по очереди.
from spire.pdf import *
from spire.pdf.common import *
# Create a PdfDocument object
doc = PdfDocument()
# Load a PDF document
doc.LoadFromFile("C:\Users\Administrator\Desktop\Input.pdf")
# Iterate through the pages
for i in range(doc.Pages.Count):
# Get a specific page
page = doc.Pages.get_Item(i)
# Create an object of PdfTextReplacer class
replacer = PdfTextReplacer(page)
# Replace the target text with new text
replacer.ReplaceAllText("old string«, «new string»)
# Save the document
doc.SaveToFile("ReplaceTextInDocument.pdf")
# Dispose resources
doc.Dispose()
Заключение
В этой статье мы узнали, как прикреплять файлы к PDF-документам в Python. Spire.PDF for Python, будучи мощной библиотекой Python, позволяет разработчикам выполнять широкий спектр операций с PDF-документами, таких как:
Извлечение вложений из PDF в Python