Apache Tika html parser module


Apache Tika html parser module

Apache Tika is a toolkit for detecting and extracting metadata and structured text content from various documents using existing parser libraries.

Compile зависимости (3)

Группа / Артифакт Версия Более новая версия
org.ccil.cowan.tagsoup » tagsoup 1.2.1 Нет
org.apache.tika » tika-parser-html-commons 2.4.1 Нет
commons-codec » commons-codec 1.15 Нет

Provided зависимости (1)

Группа / Артифакт Версия Более новая версия
org.apache.tika » tika-core 2.4.1 Нет

Test зависимости (3)

Группа / Артифакт Версия Более новая версия
org.apache.tika » tika-parser-text-module 2.4.1 Нет
org.junit.jupiter » junit-jupiter-engine 5.9.0-M1 Нет
org.junit.jupiter » junit-jupiter-api 5.9.0-M1 Нет