Как преобразовать PDF в HTML в Java
Формат PDF обеспечивает единообразное представление документов на разных устройствах. Однако если вам нужно поместить PDF-документы на веб-страницы, лучше преобразовать их в HTML-файлы. В этом случае все содержимое документа будет отображаться в браузере напрямую, без необходимости загрузки файлов. Кроме того, по сравнению с PDF-файлами, поисковым системам гораздо проще просматривать HTML-страницы для получения информации, что позволит вашему сайту получить большее распространение. В этой статье мы расскажем, как конвертировать PDF-документы в HTML-файлы на Java с помощью Free Spire.PDF for Java.
- Преобразование PDF-документа в HTML-файл на Java
- Преобразование PDF-документа в HTML-поток в Java
Установка файла Free Spire.Pdf.jar
Если вы создали
Maven-проект, вы можете легко импортировать jar в свое приложение, используя следующие
конфигурации. Для проектов, не использующих Maven, загрузите jar-файл по этой ссылке
и добавьте его в качестве зависимости в свое приложение.
Преобразование PDF-документа в HTML-файл на Java
С помощью Spire.PDF для Java вы можете загрузить PDF-файл с помощью метода PdfDocument.loadfFromFile() и преобразовать его в HTML-файл с помощью метода PdfDocument.saveToFile().
import com.spire.pdf.*;
public class convertPDFToHTML {
public static void main(String[] args) {
//Create an object of PdfDocument
PdfDocument pdf = new PdfDocument();
//Load a PDF file
pdf.loadFromFile("C:/Guide to a Foreign Past.pdf");
//Save the PDF file as an HTML file
pdf.saveToFile("PDFToHTML.html",FileFormat.HTML);
pdf.close();
}
}
Преобразование PDF-документа в HTML-поток в Java
Вместо того чтобы преобразовывать PDF в HTML-файл, вы также можете преобразовать его в HTML-поток с помощью метода PdfDocument.saveToStream(). В следующем коде приведен пример.
import com.spire.pdf.*;
import java.io.*;
public class convertPDFToHTMLStream {
public static void main(String[] args) throws FileNotFoundException {
//Create an object of PdfDocument
PdfDocument pdf = new PdfDocument();
//Load a PDF file
pdf.loadFromFile("C:/Guide to a Foreign Past.pdf");
//Save the PDF file as HTML stream
File outFile = new File("PDFToHTMLStream.html");
OutputStream outputStream = new FileOutputStream(outFile);
pdf.saveToStream(outputStream, FileFormat.HTML);
pdf.close();
}
}
Резюме
В этой статье мы узнали, как с помощью Free Spire.PDF for Java конвертировать PDF в HTML. Кроме того, компонент поддерживает другие функции обработки PDF, такие как:
Преобразование PDF в изображения в Java