Как преобразовать PDF в Word в Java
В настоящее время преобразовать PDF-документы в файлы Word с помощью программного обеспечения не составляет труда. Однако если при конвертировании необходимо сохранить макет и даже форматирование шрифтов, то это под силу не каждому программному обеспечению. Free Spire.PDF for Java справляется с этой задачей и предлагает следующие два режима конвертирования PDF в Word на Java.
- Конвертирование PDF в Doc/Docx с фиксированным макетом
- Конвертация PDF в Doc/Docx с плавной структурой
Установка файла Free Spire.Pdf.jar
Если вы создали
Maven-проект, вы можете легко импортировать jar в свое приложение, используя
следующие конфигурации. Для проектов, не использующих Maven, загрузите jar-файл
по этой
ссылке и добавьте его в качестве зависимости в свое приложение.
Преобразование PDF в Doc/Docx с фиксированным макетом
Режим Fixed Layout отличается высокой скоростью конвертирования и позволяет в наибольшей степени сохранить исходный вид PDF-файлов. Однако возможности редактирования полученного документа будут ограничены, поскольку каждая строка текста в PDF будет представлена в отдельном фрейме в сгенерированном документе Word.
import com.spire.pdf.FileFormat;
import com.spire.pdf.PdfDocument;
public class ConvertPdfToWordWithFixedLayout {
public static void main(String[] args) {
//Create a PdfDocument object
PdfDocument doc = new PdfDocument();
//Load a sample PDF document
doc.loadFromFile("C:\Users\Administrator\Desktop\sample.pdf");
//Convert PDF to Doc and save it to a specified path
doc.saveToFile("output/ToDoc.doc", FileFormat.DOC);
//Convert PDF to Docx and save it to a specified path
doc.saveToFile("output/ToDocx.docx", FileFormat.DOCX);
doc.close();
}
}
Преобразование PDF в Doc/Docx с плавной структурой
Потоковая структура - это режим полного распознавания. Преобразованное содержимое не будет представлено в виде фреймов, а структура результирующего документа будет плавной. Созданный документ Word легко поддается повторному редактированию, однако его внешний вид может отличаться от исходного PDF-файла.
import com.spire.pdf.FileFormat;
import com.spire.pdf.PdfDocument;
public class ConvertPdfToWordWithFlowableStructure {
public static void main(String[] args) {
//Create a PdfDocument object
PdfDocument doc = new PdfDocument();
//Load a sample PDF document
doc.loadFromFile("C:\Users\Administrator\Desktop\sample.pdf");
//Convert PDF to Word with flowable structure
doc.getConvertOptions().setConvertToWordUsingFlow(true);
//Convert PDF to Doc
doc.saveToFile("output/ToDoc.doc", FileFormat.DOC);
//Convert PDF to Docx
doc.saveToFile("output/ToDocx.docx", FileFormat.DOCX);
doc.close();
}
}
Pезюме
В этой статье мы узнали, как использовать Free Spire.PDF for Java для преобразования PDF-документов в документы Word. Кроме того, компонент поддерживает и другие возможности обработки PDF-документов, такие как:
Преобразование PDF в изображения в Java