5 Июля 2024 Nikita 158166 472 0 В избр. Сохранено

Как найти и заменить текст в PDF

В этой статье вы узнаете, как заменить текст на странице PDF или во всем PDF-документе с помощью Python.

Мнение автора может не совпадать с мнением редакции

Умение находить и заменять текст в документах PDF — ценный навык, имеющий широкое применение. Будь то профессиональные, академические или личные нужды, эта возможность позволяет пользователям эффективно обновлять информацию, обеспечивать точность, поддерживать соответствие требованиям и оптимизировать различные рабочие процессы.

В этой статье вы узнаете, как заменить текст на странице PDF или во всем PDF-документе с помощью Python.

Поиск и замена текста на определенной странице PDF
Найти и заменить текст во всем PDF-документе

Установите зависимость

Это решение требует установки в качестве зависимости Spire.PDF for Python, которая представляет собой библиотеку Python для чтения, создания и работы с PDF-документами в программах на Python. Вы можете установить ее, выполнив следующую команду pip.

pip install Spire.PDF

Поиск и замена текста на определенной странице PDF

С помощью Spire.PDF вы получаете определенную страницу из PDF с помощью метода PdfDocument.Pages.get_Item(), а затем заменяете целевой текст на новый с помощью метода PdfTextReplacer.ReplaceAllText().

from spire.pdf import *

from spire.pdf.common import *

# Create a PdfDocument object

doc = PdfDocument()

# Load a PDF document

doc.LoadFromFile("C:\Users\Administrator\Desktop\Input.pdf")

# Get a specific page

page = doc.Pages.get_Item(0)

# Create an object of PdfTextReplacer class

replacer = PdfTextReplacer(page)

# Replace the target text with new text

replacer.ReplaceAllText("old string«, «new string»)

# Save the document

doc.SaveToFile("ReplaceTextInPage.pdf")

# Dispose resources

doc.Dispose()

Найти и заменить текст во всем PDF-документе

Теперь вы узнали, как заменить текст на определенной странице PDF-документа. Вы перебираете страницы документа с помощью цикла for и заменяете текст на этих страницах по очереди.

from spire.pdf import *

from spire.pdf.common import *

# Create a PdfDocument object

doc = PdfDocument()

# Load a PDF document

doc.LoadFromFile("C:\Users\Administrator\Desktop\Input.pdf")

# Iterate through the pages

for i in range(doc.Pages.Count):

# Get a specific page

page = doc.Pages.get_Item(i)

# Create an object of PdfTextReplacer class

replacer = PdfTextReplacer(page)

# Replace the target text with new text

replacer.ReplaceAllText("old string«, «new string»)

# Save the document

doc.SaveToFile("ReplaceTextInDocument.pdf")

# Dispose resources

doc.Dispose()

Заключение

В этой статье мы узнали, как прикреплять файлы к PDF-документам в Python. Spire.PDF for Python, будучи мощной библиотекой Python, позволяет разработчикам выполнять широкий спектр операций с PDF-документами, таких как:

Извлечение вложений из PDF в Python

Преобразование PDF в Word с помощью Python

Преобразование PDF в изображения с помощью Python

В избр. Сохранено

Как найти и заменить текст в PDF

Установите зависимость

Поиск и замена текста на определенной странице PDF

Найти и заменить текст во всем PDF-документе

Заключение

Перечень запрещённых/экстремистских организаций и иностранных агентов

Запрещённые/экстремистские организации и сообщества

Перечень иностранных агентов и запрещённых СМИ