Apache Tika 1.4

Apache Tika er en open source toolkit designet til at detektere og udtrække metadata, samt struktureret indhold tekst fra flere dokumenter, ved hjælp af intet andet end eksisterende parser biblioteker.Apache Tika understøtter følgende dokumentformater:...