Как преобразовать Word в HTML в Java
Файл HTML (Hyper Text Markup Language) — это веб-страница, написанная на языке HTML, которая может быть отображена в веб-браузере. Он широко используется в Интернете, поскольку большинство статических веб-страниц имеют расширение .html. В некоторых случаях требуется преобразовать некоторые форматы документов (например, Word) в HTML. В этом руководстве будет показано, как преобразовать Word в HTML с помощью Free Spire.Doc for Java.
Установка файла Free Spire.Doc.jar
Если вы создали
Maven-проект, вы можете легко импортировать jar в свое приложение, используя
следующие конфигурации. Для проектов, не использующих Maven, загрузите jar-файл
по этой
ссылке и добавьте его в качестве зависимости в свое приложение.
Преобразование Word в HTML в Java
Бесплатная программа Spire.Doc для Java позволяет легко конвертировать Word в HTML с помощью метода Document.saveToFile(). Порядок действий приведен ниже.
- Создайте экземпляр документа Document.
- Загрузите документ Word с помощью метода Document.loadFromFile().
- Сохранить документ в виде HTML-файла с помощью метода Document.saveToFile().
import com.spire.doc.*;
public class WordToHtml {
public static void main(String[] args) {
//Create a Document instance
Document document = new Document();
//Load a Word document
document.loadFromFile("C:\Users\Test1\Desktop\sample.docx");
//Save the document as HTML
document.saveToFile("output/toHtml.html", FileFormat.Html);
}
}
Pезюме
В этой статье мы научились конвертировать документы Word в HTML с помощью Free Spire.Doc for Java.Компонент также поддерживает преобразование между другими форматами, такими как:
Преобразование Word в изображения в Java