Apache OpenNLP tillader en udvikler at fodre systemet en blok af tekst og bruge en samling af NLP (Neuro-Lingvistisk Programmering) redskaber til at opdage forskellige komponenter.
OpenNLP vil være i stand til at opdage sætninger, sætning komponentdele, enhed udfører afsløring, tekst parsing & opdeling, og mange andre komplekse operationer.
Resultaterne af disse opgaver kan tilføres andre tekst forarbejdning motorer, der arbejder med mindre tekst prøver og ville ikke være i stand til at håndtere større blokke på samme effektivitet.
OpenNLP kan bruges i søgemaskiner, dokument formatering, dokument parsing, Webcrawlere, og så videre.
Da projektet bruger maskine læringsmetoder, jo mere tekst, du fodrer Apache OpenNLP, jo bedre bliver det på sit arbejde
Hvad er nyt i denne udgivelse:.
< p>- Porter Stemmer værktøj
- L-BFGS parameterestimering
- Forbedret dokumentation
- Finkornet POSTagger evalueringsrapport
- Forbedret støtte til belastning bruger forudsat funktion generator og kontekst validering klasser fra OSGi miljø
Hvad er nyt i version 1.5.3:
- Porter Stemmer værktøj
- L-BFGS parameterestimering
- Forbedret dokumentation
- Finkornet POSTagger evalueringsrapport
- Forbedret støtte til belastning bruger forudsat funktion generator og kontekst validering klasser fra OSGi miljø
Hvad er nyt i version 1.5.2:
- Forbedret den hvide plads håndtering i Sætning Detector og dens
- uddannelse koden
- Tilføjet mere cross validator kommandolinjeværktøjer
- Kommando linje håndtering kode er blevet refactored
- Faste problemer med nybyggeri
- Nu bruger hurtigt token klasse funktionen generation kode som standard
- Tilføjet understøttelse af BioNLP / NLPBA 2004 fælles opgave data li>
- Fjernelse af gammelt og forældet kode
- ordbog tilfælde følsomhed støtte nu gøres ordentligt
- Understøttelse af OSGi
Hvad er nyt i version 1.5.1:
- Wiki dokumentation konverteret til DocBook
- F-Measure præcision fix (OPENNLP-59)
- Perceptron fejlrettelser
- CoNLL 2003 uddannelse format support
- Chunker evaluering støtte
- Chunker understøtter nu Portugisisk Bosque AD-format
- Chunker refactoring
Kommentarer ikke fundet