Об'єднання сторінок з різних PDF у вигляді сітки за допомогою pypdf

Об’єднання сторінок з різних PDF у вигляді сітки за допомогою pypdf

8 Березня 2024 в 23:51 292

В обробці документів у форматі PDF часто виникає необхідність об’єднати кілька файлів у один або виконати інші маніпуляції зі сторінками. Однією з таких завдань є створення одного файлу, що містить усі сторінки з різних PDF-документів у вигляді сітки. Це може бути корисно, наприклад, для створення зведеної таблиці, яка містить інформацію з різних джерел або для порівняння документів.

Завданням є створення файлу summary.pdf, що містить всі сторінки з кількох вихідних PDF-файлів. Кожна сторінка summary.pdf повинна вміщувати сторінки з різних PDF-файлів у вигляді сітки, де перший ряд містить сторінки першого PDF, другий ряд – сторінки другого PDF і так далі.

Для вирішення цієї задачі можна використати бібліотеку PyPDF2 для Python. PyPDF2 – це бібліотека, яка дозволяє працювати з PDF-файлами, включаючи читання, редагування та створення нових файлів PDF.

Нижче наведений приклад коду на Python, який демонструє, як об’єднати сторінки з різних PDF-файлів у вигляді сітки за допомогою бібліотеки PyPDF2:

import PyPDF2
# Створення об'єкта для зберігання вихідних сторінок
output_pdf = PyPDF2.PdfWriter()
# Список PDF-файлів
pdf_files = ["1.pdf", "2.pdf", "...", "n.pdf"]
# Проходження крізь усі файли
for pdf_file in pdf_files:
    # Відкриття кожного PDF-файлу
    with open(pdf_file, "rb") as file:
        pdf_reader = PyPDF2.PdfReader(file)
        # Проходження крізь усі сторінки
        for page in range(len(pdf_reader.pages)):
            # Додавання кожної сторінки у вихідний PDF
            output_pdf.add_page(pdf_reader.pages[page])
# Збереження результатів у файл summary.pdf
with open("summary.pdf", "wb") as file:
    output_pdf.write(file)

import PyPDF2

# Створення об'єкта для зберігання вихідних сторінок

output_pdf = PyPDF2.PdfWriter()

# Список PDF-файлів

pdf_files = ["1.pdf", "2.pdf", "...", "n.pdf"]

# Проходження крізь усі файли

for pdf_file in pdf_files:

# Відкриття кожного PDF-файлу

with open(pdf_file, "rb") as file:

pdf_reader = PyPDF2.PdfReader(file)

# Проходження крізь усі сторінки

for page in range(len(pdf_reader.pages)):

# Додавання кожної сторінки у вихідний PDF

output_pdf.add_page(pdf_reader.pages[page])

# Збереження результатів у файл summary.pdf

with open("summary.pdf", "wb") as file:

output_pdf.write(file)

Цей код робить наступне:

Створює об’єкт output_pdf для зберігання вихідних сторінок.
Визначає список pdf_files зі шляхами до вихідних PDF-файлів.
Проходиться через кожен PDF-файл.
Додає кожну сторінку з кожного PDF-файлу до вихідного PDF-файлу.
Зберігає отриманий результат у файлі summary.pdf.

Після виконання цього коду ви отримаєте файл summary.pdf, який містить всі сторінки з різних PDF-файлів у вигляді сітки, як було вказано у вихідному завданні.