Apache Tika html parser module


Apache Tika html parser module

Apache Tika is a toolkit for detecting and extracting metadata and structured text content from various documents using existing parser libraries.

Compile зависимости (4)

Группа / Артифакт Версия Более новая версия
org.apache.tika » tika-parser-html-commons 2.0.0 Нет
org.apache.tika » tika-core 2.0.0 Нет
org.ccil.cowan.tagsoup » tagsoup 1.2.1 Нет
commons-codec » commons-codec 1.15 Нет

Test зависимости (2)

Группа / Артифакт Версия Более новая версия
junit » junit 4.13.2 Нет
org.apache.tika » tika-parser-text-module 2.0.0 Нет