Image

Такой вопрос коллеги.

Кто чего может посоветовать из пакетов которые могут корректно работать с содержимым следующих файлов.
.doc
.xls
.pdf

Собственно всё это уже есть и написано но высокое начальство по каким то причинам не устраивает вот
и хочу у коллективного разума спросить :)
Собственно для ворда с ёкселем сейчас юзается апачевское POI а для PDF - www.pdfbox.org.

Потом это всё суётся в индекс для люсены ( lucene)

Хочется спросить не знает ли кто нибудь чего нибудь того что покруче для этих целей:)