LanguageTool

Software screenshot:
LanguageTool
Software detaljer:
Version: 2.9 Opdateret
Upload dato: 14 Apr 15
Udvikler: Daniel Naber
Licens: Gratis
Popularitet: 18

Rating: nan/5 (Total Votes: 0)

LanguageTool er et open source korrekturlæsning program designet til at finde fejl, regelmæssige spell checker værktøjer ikke kan registrere. Det er en regelbaseret stil og grammatikkontrol, der vil finde fejl, for hvilke en regel er defineret i dens XML konfigurationsfiler, såsom blanding op & ldquo; deres & rdquo; med & ldquo;. der & rdquo;


Registrerer forskellige grammatiske problemer

Programmet kan også opdage forskellige grammatiske problemer og kommer med understøttelse af mere end 20 sprog, herunder engelsk, tysk, polsk, fransk, spansk, svensk, kinesisk, dansk, japansk, islandsk, portugisisk og brasiliansk portugisisk.
Derudover er det prale med en nem at bruge, enkel og ligetil grafisk brugergrænseflade, der giver alle mulighed for at indsætte tekst, der skal stave kontrolleret. Det kan kontrollere teksten i klippebordet, tag tekst, klippe / kopiere / indsætte tekst, og opholde sig i systembakken området.


Detekterer en bred vifte af problemer

Fra dialogboksen Indstillinger, kan du aktivere hvilken type problemer ansøgningen kan detektere, herunder dårlig stil, grammatiske fejl, slang, tegnsætning fejl, mulige stavefejl, redundante sætninger, almindeligt forvirrede ord kollokationer, kapitalisering, semantik, samt som ikke-standard fraser.


LanguageTool for LibreOffice og OpenOffice

Udover at være et selvstændigt program, LanguageTool er også tilgængelig som en udvidelse til to af de mest populære og magtfulde open source kontorpakker, LibreOffice og Apache OpenOffice.org, så brugerne kan læse korrektur deres tekster ved at højreklikke på udvalgte sætninger eller afsnit.


LanguageTool for Mozilla Firefox

Desuden er programmet er også tilgængelig for download som et add-on til verden & rsquo; s mest populære open source-browser i verden, Mozilla Firefox. Det kræver ingen genstart og placerer en lille knap på hovedværktøjslinjen, så du kan læse korrektur markerede tekst fra hjemmesider eller former.


Under kølerhjelmen og tilgængelighed

Ansøgningen er helt skrevet i programmeringssproget Java, hvilket betyder, at det & rsquo; s cross-platform software, der er designet til at arbejde med alle GNU / Linux-distribution, såvel som BSD, Solaris, Microsoft Windows og Mac OS X-operativsystemet systemer, hvor Java Runtime Environment er installeret.

Hvad er nyt i denne udgivelse:

  • catalansk:
  • opdateret POS tag ordbog
  • tilføjet nye regler
  • faste falske alarmer
  • Engelsk:
  • Tilføjet et par regler og faste et par falske alarmer
  • Tilføjet mange nye stil regler bidraget med Heikki Lehvaslaiho. Da disse kan forårsage falsk alarm, er de ikke aktiveret som standard. Du kan aktivere dem ved at tænde alle regler i den nye 'Plain English' kategori.
  • esperanto:
  • tilføjet et par nye regler
  • Fransk
  • opdateret POS tag ordbog og Hunspell ordbog til Dicollecte-5,3
  • tysk:
  • tilføjet et par nye regler og faste falske alarmer
  • Tilføjet en ny regel, der kontrollerer for emne verbum aftale. For nu er der kun tilfælde med 'ist', 'sind', 'krig', og 'Waren «understøttet. Eksempel for fejl, der er opdaget: ". Der Hund sind Schà & para n ',' Die Biler ist schnell.« For at gøre denne regel arbejde, er sætninger nu forenet i disambiguation.xml: for eksempel "Mann" i udtrykket »ein Mann" vil kun bevare sin nominative læsning (SUB: NOM: SIN: MAS), mens det bruges også til at have akkusativ og dativ aflæsninger (SUB: AKK: SIN: MAS, SUB: DAT: SIN: MAS). (Https://github.com/languagetool-org/languagetool/issues/233)
  • Italiensk:
  • forbedret et par regler
  • polsk:
  • tilføjet flere nye regler
  • portugisisk:
  • tilføjede / forbedrede flere regler
  • 3695 sammensatte ord (før reformen) - den største gratis database
  • russisk:
  • tilføjede og forbedrede regler
  • ukrainsk:
  • stor ordbog opdatering
  • nye grammatiske regler
  • nye enkle erstatter regel for bløde forslag
  • disambiguator forbedringer
  • sammensatte tagging og stavning forbedringer
  • initialer tagging forbedringer
  • punktum og ord tokenizing forbedringer
  • forbedret håndtering af stres symbol og blød bindestreg
  • Bitext regler:
  • tilføjet en simpel regel for at kontrollere, om oversættelser ender med samme tegnsætningstegn som originalen (kun dette omfatter.?! Tegn).
  • er det nu muligt at tilføje eksterne bitext regel filer på kommandolinjen, ved hjælp af
  • -bitextrule mulighed. Filstien skal være absolut. Bemærk:. Dette tillader bruger bitext regler også for sprog, der ikke har bitext regler, der indgår som standard
  • Stavning:
  • De nye filer på /hunspell/spelling.txt kan bruges til at tilføje accepterede ord til stavekontrollen, der også overvejes, når der oprettes forslag til forkert stavede ord. Dette svarer til de /hunspell/ignore.txt filer, som liste accepterede ord, der * ikke * bruges, når du opretter forslag til forkert stavede ord.
  • API:
  • JLanguageTool.activateDefaultPatternRules () og JLanguageTool.activateDefaultFalseFriendRules () er blevet fjernet - alle regler mønster og falske venner regler (hvis et andet sprog er angivet) nu aktiveres automatisk, når konstruktøren af ​​JLanguageTool hedder. Skulle du have en brik uden regler XML-baserede mønster, udvide dit sprog klasse (fx 'engelsk') med en, der overskriver getPatternRules () metode og returnerer en tom liste der.
  • ManualTagger.lookup () er blevet erstattet af ManualTagger.tag () efter at være blevet frarådet siden sidste udgivelse
  • Alle statiske metoder og felter fra klassen 'Sprog' er blevet flyttet til den nye klasse 'sprog'. For nu, / felter i klassen Sprog findes stadig metoder, men er blevet frarådet.
  • LanguageIdentifierTools er blevet fjernet. Brug LanguageIdentifier i stedet.
  • Fjernet (Standard) ResourceDataBroker.setResourceDir () og setRulesDir (), da disse kan indstilles med konstruktøren
  • Renset op op klasse bidragyder, f.eks fjernelse getRemark ()
  • Category.setDefaultOff () er blevet fjernet, det kan indstilles via konstruktør nu
  • Omdøbt klasser: o.lt.rules.patterns.Element = & gt; o.lt.rules.patterns.PatternToken o.lt.rules.patterns.ElementMatcher = & gt; o.lt.rules.patterns.PatternTokenMatcher
  • Andre små API oprydninger, der bør ikke berøre de fælles use cases, f.eks IncorrectExample.getCorrections () returnerer og unmodifiable liste nu, fjernelse af frarådede metoder.
  • Integreret server:
  • XML undslippe er fastsat, kan dette medføre ugyldige XML-dokumenter skal returneres
  • ny konfigurationsfil option 'maxWorkQueueSize ", der lader dig indstille den maksimale størrelse af anmodningen kø - hvis det får større end dette, vil anmodninger blive afvist (503 Tjenesten er ikke tilgængelig)
  • Serveren nu svarer med mere specifikke HTTP statuskoder på disse fejltilstande: 413 Anmodning Entity Too Large - hvis teksten overskrider maksimal tekststørrelse 503 Tjenesten er ikke tilgængelig - hvis kontrol overskrider maksimal kontrol tid
  • GUI:
  • Den selvstændige GUI kan nu tage en almindelig tekstfil som et argument, vil denne fil derefter indlæses ved opstart (Github spørgsmålet # 232).
  • Kommando-linje:
  • Det er nu muligt at tilføje en ekstern regel fil, når du ringer LanguageTool fra kommandolinjen. Brug --rulefile at tilføje en fil. Hvis filnavnet har et format, der indeholder et sprog navn, vil det blive brugt sammen med andre regler; ellers vil det erstatte reglerne. Du kan også indlæse en ekstern fil med falske venner ved hjælp af option --falsefriends. Filnavnet skal være en absolut sti, og falske venner filer er altid sat til dem, der er indlæst for sproget. (Github problem # 192)
  • Regel syntaks:
  • En regel kan nu have en enkelt eksempel sætning, så længe det har en 'korrektion' attribut - det kan spare nogle redundans, hvis det eneste rigtige sætning er den samme som den forkerte sætning med korrektion. Før, en regel nødvendig mindst to eksempler sætninger.
  • 'eksempel' element: type = "forkert" er nu obligatorisk, hvis der er en "korrektion" attribut. Den "korrektion" attribut indebærer, at sætningen er forkert.
  • 'eksempel' element: type = "korrekt" er nu valgfri. Ingen »type« attribut og ingen "korrektion" attribut indebærer, at sætningen er korrekt.
  • Intern:
  • Vi har skiftet fra Apache Tika til sprog-detektor (https://github.com/optimaize/language-detector) til automatisk at identificere tekst sprog. Det bør være hurtigere og resultaterne skal være mere pålidelige. Påvisning af Asturian og galicisk måtte være deaktiveret fordi kvaliteten afsløring var for lav, og også påvirket påvisning af spansk.
  • Rettet en regression, der gjorde det umuligt at indlæse eksterne regel filer i GUI.

Hvad er nyt i version 2.8:

  • asturisk:
  • fjernet afhængighed Hunspell, nu bruger Morfologik til stavekontrol
  • bretonsk:
  • tilføjet og forbedret et par regler
  • catalansk:
  • opdateret ordbog
  • tilføjede og forbedrede regler
  • faste falske alarmer
  • hollandsk:
  • tilføjede og forbedrede mange regler
  • Engelsk:
  • nogle nye regler (tak til Nick Hough)
  • opdateret tagger og synthesizer ordbøger, om fastsættelse af spørgsmålet # 202
  • nyt filter der skal bruges til at matche partofspeech af dele af ord, fx:. I * Dette vil kun holde kampe for ord, der starter med "i", og hvor en del efter den "i" er et adjektiv (POS-tag "JJ"). Den "nej: 1 'er den token position, dvs. her den første (og eneste) matching henvises til
  • .
  • fransk:
  • tilføjet og forbedret et par regler
  • tysk:
  • tilføjet og forbedret et par regler
  • polsk:
  • tilføjede og forbedrede flere regler
  • tilføjet og forbedret falske venner med engelsk
  • portugisisk:
  • tilføjede / forbedrede flere regler
  • spansk:
  • fjernet afhængighed Hunspell, nu bruger Morfologik til stavekontrol
  • omformateret regler fil
  • Tilføjet flere regler
  • Tagalog:
  • fjernet afhængighed Hunspell, nu bruger Morfologik til stavekontrol
  • Dash tegn ("") er en afgrænsningstegn nu, hvor tokenizing teksten
  • russisk:
  • tilføjede og forbedrede regler
  • tilføjet et par falske venner regler (russisk / engelsk)
  • ukrainsk:
  • mange nye regler (herunder aftale med substantiver, tid udtryk osv)
  • regel dækning forbedring
  • ordbog opdatering (store forbedringer for egennavne og Vokativ)
  • nyt tag og herske at advare om alternativ stavemåde
  • tilføjede ord frekvens oplysninger til at forbedre staveforslag
  • nogle nye disambiguator regler
  • Regel Syntaks:
  • ... kan nu føjes til en rulegroup at påvirke alle reglerne i denne gruppe
  • Hvis du udvikler dine egne regler, som ikke er en del af LT kan du nu tilføje ekstern = "ja" til dine kategorier for at forhindre link regel at community.languagetool.org vises i vores standalone GUI (linket ville ikke arbejde regler, som ikke er en del af den primære fordeling af LT). (Github problem # 223)
  • Hvis en regel gruppe angiver default = "off", reglerne inde reglen gruppe kan ikke også angive default = "on" / "off".
  • API:
  • Fjernede klasser og metoder, der var blevet forældede siden 2,7 eller længere
  • Integreret server:
  • konfigurationsfilen indstillinger 'requestLimit "og" requestLimitPeriodInSeconds' kan nu også bruges til HTTP-serveren (ikke kun for HTTPS server)
  • Ny config file option 'trustXForwardForHeader «: indstille denne til' true ', hvis du kører serveren bag en reverse proxy og ønsker grænse anmodningen til at arbejde på de originale IP-adresser, som den" Xforwardedfor' HTTP header, som regel fastsat af proxy. Hvis du kører bag en proxy, men ikke indstille denne egenskab til sand, kan en bruger bruge alle de anmodninger, så andre brugere også vil få en fejlmeddelelse på grund af grænsen anmodningen.
  • Fix respons Efter Deadline mode: ... var til tider tom, forvirrende teksten check i WordPress
  • Bitext regler blev ikke slået ordentligt, selv om de var angivet med en ordentlig parameter for serveren; nu er det fast
  • Rettet problem med forkerte positioner for nogle bitext regler (spørgsmål # 218)
  • GUI:
  • En ny "errorColors 'indstilling er tilføjet til languagetool.cfg konfigurationsfil. Det kan bruges til at indstille baggrundsfarven for fejl. For eksempel errorColors = typografisk: # b8b8ff, stil: vil # ffb8b8 vise 'typografiske' fejl med en blå baggrund og "stil" fejl med en rød baggrund i den øvre del af LT-vinduet. "Typografisk" og "stil" er de typer, der er fastsat i grammar.xml som "type = ...". Der er ingen brugergrænseflade endnu at konfigurere disse farver. Bemærk, at du kun skal redigere languagetool.cfg filen, når LT ikke kører.
  • Intern:
  • Bugfix: regler inde i en regel gruppen havde ikke blevet aktiveret, hvis en tidligere regel fra samme rulegroup anvendte standard = "off"
  • Ord er ikke ignoreres længere af stavekontrollen, bare fordi de forekommer i en regel forslag. Hvis du vil have stavekontrollen til at ignorere ord globalt, tilføje dem til hunspell / ignore.txt. At ignorere dem, afhængigt af kontekst, tilføje en 'ignore_spelling regel at disambiguation.xml.
  • En fil "hunspell / prohibit.txt 'kan nu bruges til at markere ord som stavefejl, selvom stavekontrollen normalt ville acceptere dem. Dette er nyttigt for at forbedre LanguageTool stavekontrollen uden at vente på den opstrøms brik, der skal opdateres. Den "prohibit.txt" fil er det modsatte af 'ignore.txt «, hvilket får stavekontrollen til at ignorere ord.
  • partofspeech tagger for de fleste sprog kan nu udvides ved at tilføje indgange til filen org / LanguageTool / ressource / XX / added.txt (XX er den sprogkode). Formatet er "fullform baseform postag", tre kolonner adskilt af faner. Det gør det lettere for brugere (og udviklere) at udvide POS tagger, da de ikke har brug for at eksportere, ændre og genskabe den binære ordbog for hver ændring.

Hvad er nyt i version 2.7:

  • bretonsk:
  • tilføjede og forbedrede regler
  • Ny regel, der kontrollerer, om en hverdag matcher en dato, f.eks registrerer "Gwener 28 a nemlig Eost 2014", da denne dato er ikke en fredag.
  • catalansk:
  • tilføjede og forbedrede regler
  • faste falske alarmer
  • hollandsk:
  • tilføjede og forbedrede mange regler
  • skiftede til Morfologik-baserede stavekontrol
  • -Engelsk:
  • Vil du være en del af det team, der udvikler verdens mest magtfulde Open Source korrekturlæsning værktøj? Vi leder efter en vedligeholder for de engelske regler LanguageTool. Se http://wiki.languagetool.org/tasks-for-language-maintainers for detaljer.
  • Alle engelske ordbøger er blevet udvidet til at indeholde ord frekvens klasser for at forbedre spell checker forslag (frekvens data er taget fra https://github.com/mozilla-b2g/gaia/tree/master/apps/keyboard/js / IME'er / latin / ordbøger, som for andre sprog, der allerede bruger denne funktion).
  • Bedre forslag til engelske elever: uregelmæssige verber, substantiver og adjektiver nu normalt har en bedre forslag. For eksempel 'thinked' antyder "tænkte«, »womans 'antyder" kvinder ".
  • Flere stavefejl med forslag nu, f.eks "Garentee« (garanti), 'greatful' (taknemmelig). Dette kan medføre et fald udførelsen af ​​~ 10% (mere for tekster med en masse ukendte ord).
  • Ny regel, der kontrollerer, om en hverdag matcher en dato, f.eks registrerer "mandag, oktober 7, 2014", da denne dato er ikke en mandag. Denne regel vil kun fungere, hvis den opdager datoformatet i brug. Indtil videre er disse formater understøttes: * "Mandag 7 oktober, 2014" * "mandag, oktober 7, 2014" * "mandag Oktober 7, 2014" * "MANDAG oktober 7, 2014" * (dette virker også med forkortet uge dage som Mo eller Mon for mandag)
  • esperanto:
  • Ny regel, der kontrollerer, om en hverdag matcher en dato, f.eks registrerer "Vendredon la 28-an de AAgusto 2014", da denne dato er ikke en fredag.
  • fransk:
  • opdateret POS tag ordbog og Hunspell ordbog til Dicollecte-5,2
  • tilføjet en synthesizer - aftalen reglen kan nu komme med forslag til nogle fejl
  • tilføjede / forbedrede flere regler
  • Ny regel, der kontrollerer, om en hverdag matcher en dato, f.eks registrerer "Vendredi 28/08/2014" som denne dato ikke er en fredag.
  • tysk:
  • Rettet en sjælden NullPointerException og en ArrayIndexOutOfBoundsException
  • Faste flere falske alarmer
  • Tilføjet og forbedrede regler
  • Ny regel, der kontrollerer for straffe uden et verbum (slået fra som standard på grund af risikoen for falske alarmer)
  • Ny regel, der kontrollerer, om en hverdag matcher en dato, f.eks registrerer "Dienstag, 2014/09/29", da denne dato er ikke en tirsdag.
  • ydeevne forbedringer for stavekontrol forslag
  • persisk:
  • tilføjede indledende støtte til persisk (farsi)
  • polsk:
  • tilføjet og forbedret nogle regler
  • ny regel, der kontrollerer, om en hverdag matcher en dato
  • portugisisk:
  • tilføjede / forbedrede flere regler
  • tilføjet mange snesevis af sammensatte ord
  • russisk:
  • tilføjet nye regler
  • fix SourceForge funktion anmodning # 38 (tjek for forskellige anførselstegn)
  • tilføjet et par falske venner regler (russisk / engelsk)
  • ny regel, der kontrollerer, om en hverdag matcher en dato, f.eks registrerer "ÐонеÐ'еÐ"NŒÐ½Ð¸Ðº, 30 N ?? & ETH; & micro; & ETH; & frac12; N & sbquo N ?? & ETH; & plusmn; N & euro; N ?? 2014 & ETH; & sup3 ;. "som denne dato ikke er en mandag
  • .
  • udvidet russisk sammensatte regel med nye ord fra postag ordbog
  • spansk:
  • Tilføjet ny POS kategori Z (for spelt numre, fx 'uno', 'dos', ...)
  • stavet numre kan nu registreres og forvaltes i både flertydig og regler.
  • Fast nogle forkerte lemmaer i POS ordbog.
  • Tilføjet Hybrid chunker-disambiguator.
  • Tamil:
  • Tilføjet indledende støtte til Tamil. Hvis skrifttypen for Tamil ikke er korrekt vist på computeren, og du bruger Windows, skal du måske til at anvende det arbejde omkring beskrevet her: https://bugs.openjdk.java.net/browse/JDK-8008572
  • ukrainsk:
  • stor opdatering til POS ordbog (rettelser og nye ord)
  • nogle POS tag omdøbt for konsistens; nye tags for forkortelser og sjældne ord
  • mange nye regler og rettelser til eksisterende regler
  • ny regel, der kontrollerer, om en hverdag matcher en dato, f.eks registrerer "& ETH; & ETH; & frac34; & ETH; & frac12; & ETH; & micro; & ETH« N- & ETH, "& ETH; & frac34; & ETH; & º ;, 7 & ETH; & para; & ETH; & frac34; & ETH; & sup2; 2014 ", da denne dato er ikke en mandag
  • token normalisering præstationsforbedring
  • LibreOffice integration:
  • Bliv ikke forvirret af fodnoter i LibreOffice 4.3 og senere (det nu giver os fodnoten positioner som metadata, så vi kan ignorere dem).
  • API:
  • Større ydeevne forbedringer for multi-tråd use case, hvor JLanguageTool bliver skabt pr tråd, men sproget objekt (fx 'tysk') bliver oprettet én gang. Overhead til at skabe JLanguageTool skulle nu være meget lavere.
  • Fjernede flere klasser og metoder, der var blevet forældede siden version 2.6
  • Fjernet DutchSpellerRule - brug MorfologikDutchSpellerRule stedet
  • underskrift Language.getRelevantRules () har ændret
  • De JLanguageTool og MultiThreadedJLanguageTool konstruktører ikke erklære at smide en IOException længere
  • WhitespaceRule er blevet omdøbt til MultipleWhitespaceRule (WhitespaceRule eksisterer stadig, men er blevet frarådet)
  • Forældet nogle metoder, hvis synlighed vil blive nedsat (f.eks fra offentlige til beskyttet)
  • MorfologikSpellerRule.getRuleMatch (String, int) er blevet omdøbt til MorfologikSpellerRule.getRuleMatches (String, int)
  • RuleMatch konstruktør kaster nu en undtagelse, hvis toPosition ikke er større end fromPosition
  • Indført en ny abstrakt klasse TextLevelRule der strækker regel, og som kan bruges til regler, der dækker mere end én sætninger.
  • Command line:
  • Aktivering og deaktivering af specifikke regler på samme tid er nu tilladt. For at teste kun nogle regler (invaliderende alle resten), som tidligere blev gjort med "--enable LIST_OF_RULES", nu bruge "--enabledonly --enable LIST_OF_RULES" (eller "-eo -e LIST_OF_RULES").
  • Integreret server:
  • To nye muligheder kan indstilles i egenskaberne filen at gøre LanguageTool returnere det samme XML-format, som efter fristens udløb (ATD). På denne måde kan bruges som en drop-in erstatning for ATD: * tilstand - »LanguageTool" eller "AfterTheDeadline '* afterTheDeadlineLanguage - kode standardsprog, hvis tilstanden er sat til' AfterTheDeadline 'BEMÆRK: den" AfterTheDeadline' tilstand bør overvejes eksperimenterende for nu.
  • Den nye indstilling "maxCheckThreads 'Tillader indstilling af maksimale antal tråde, der arbejder på anmodninger i parallel. Standard er 10, som det plejede at være.
  • Interne:
  • Ny abstrakt regel AbstractDateCheckFilter der gør det muligt at kontrollere, om en ugedag og dato kamp. For eksempel "Tirsdag, 29 september, 2014" kunne påvises, som 29 September, 2014 er faktisk ikke en tirsdag. Dette bruger den nye eksperimentelle RuleFilter grænseflade, der kan kaldes fra XML med den nye "filter" element. "Filter" tager disse egenskaber: "klasse": det fuldt kvalificerede navn på en Java-klasse, der implementerer RuleFilter, f.eks "org.languagetool.rules.de.DateCheckFilter" "args«: en streng som "år: 1 måned: 2 dage: 3 Ugedag: 4", dvs. et rum-adskilt liste af nøgle / værdi-par, hvor x bliver løst til mønsteret er token værdi (som i "message" element)
  • Forbindelse reglen nu ignorerer poletter, der er blevet immuniseret i disambiguation.xml
  • "filter" handling i disambiguator nu kun anvendes til POS-tags, der matcher POS tag givet. Hvis de ikke stemmer overens, er reglen ikke.
  • Hvis du udvide XML regler som beskrevet på http://wiki.languagetool.org/tips-and-tricks#toc2, de eksterne reglen og Artikler med flertydige filer kan nu være vært på en password-beskyttet server ved at angive en URL som dette: http: // bruger: password@example.org/path/user-rules.xml
  • lang tankestreg ("a & euro;" ") er nu en tokenizing tegn for alle sprog
  • Ny funktion:
  • Brug af sproglige modeller
  • LanguageTool kan nu gøre brug af Ngram data. Ngram data er oplysninger om, hvor ofte sætninger forekommer i et sprog. I øjeblikket bruger denne sætninger længde 3.
  • data bliver brugt af en engelsk regel at finde homofon fejl, ligesom blande groft / kursus eller flair / flare. LanguageTool havde nogle regler af denne art før, men den nye regel understøtter nu omkring 900 af sådanne ordpar / sæt.
  • De nødvendige data til dette er enorm (7 GB til engelsk), og dermed ikke en del eller LanguageTool.
  • Dataene (kun engelsk for nu) og mere dokumentation er tilgængelig på http://wiki.languagetool.org/finding-errors-using-big-data
  • Brug ngrams gør LanguageTool lidt langsommere, når data er lagret på en SSD.
  • Hvis ikke gemt på en SSD, kan ydeevnen drastisk falde.
  • Brug den nye --languagemodel option med kommandolinjen klienten for at aktivere den regel, der bruger data. Denne mulighed er endnu ikke tilgængelig for stand-alone GUI.

Hvad er nyt i version 2.4.1:

  • Opdateret Morfologik biblioteker til 1.8.3 at fastsætte langsomme forslag i stavekontrollen, hvilket påvirkede det mindste da-DK

Hvad er nyt i version 2.4:

  • bretonsk:
  • SRX sætning tokenization
  • tilføjede / forbedrede nogle få regler
  • faste nogle falske alarmer
  • fast forkerte suggestions takket være tilføjet tests på korrektioner
  • catalansk:
  • tilføjede / forbedrede flere regler
  • faste falske alarmer
  • lavet tilføjelser og rettelser til tagger ordbogen
  • fjernet nogle ord fra syntese ordbog (se filterarchaic.txt)
  • tilføjede frekvens data til tagger ordbogen; frekvens ordliste kommer fra Gaia-projektet, med Apache License, version 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
  • Engelsk:
  • tilføjede / forbedrede nogle få regler
  • faste nogle falske alarmer
  • fransk:
  • tilføjede / forbedrede flere regler
  • faste nogle falske alarmer
  • tysk:
  • tilføjede / forbedrede flere regler
  • tilføjet en synthesizer aftalen reglen kan nu komme med forslag til nogle fejl (ikke alle forslag er korrekte, men)
  • polsk:
  • tilføjede / forbedrede flere regler, især for bindestreg og tankestreg forbrug
  • tilføjede oplysninger om stavekontrol ordbog frekvens; frekvens ordliste kommer fra Gaia-projektet, med Apache License, version 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
  • faste nogle falske alarmer
  • portugisisk:
  • tilføjede / forbedrede flere regler (det omfatter nu kønsspecifikke regler "a" / "o")
  • det nu har 3400+ sammensatte ord
  • JAR-filen er blevet omdøbt til languagetool.jar, fra tidligere languagetoolstandalone.jar at undgå forvirring om, hvad "standalone" forstås i denne sammenhæng (github problem # 29)
  • for sprog med mange regler (som fransk eller tysk) ydeevne på lange tekster er blevet forøget med omkring 2030%
  • rettelse til threadsafety (kunne forårsage hænge i MultiWordChunker)
  • rettet en fejl, hvor luns anmærkninger ikke blev testet i grupper
  • fix: 1 og ikke var blevet evalueret i ...
  • rettet en fejl i forening mekanisme, der kasseret nogle af de matchende fortolkninger for tidligt
  • tilføjet støtte til luns anmærkninger i disambiguator og fast én fejl i filtrering tokens med luns anmærkninger
  • opdaterede Morfologik biblioteker til 1.8.2 (fejlrettelser, strengere input tilregnelighed kontrol, tilføjer frekvens data til ordbøger)
  • tilføjet muligheden for at inkludere frekvens data til taggging eller stave ordbøger. Den forventede format frekvensen ordlister er den i Gaia-projektet, med Apache License, version 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries)
  • nye kommandolinje værktøjer til at eksportere og skabe binære ordbøger:
  • org.languagetool.dev.DictionaryExporter
  • org.languagetool.dev.POSDictionaryBuilder
  • LibreOffice / OpenOffice integration:
  • tilføjet en løsning for ukorrekt sætning detektion for det tilfælde, at en fodnote viste sig efter en sætning fuld stop (Sourceforge bug # 191)
  • standalone GUI:
  • Dialogen åbnes af "More ..." element i genvejsmenuen for en fejl, vil nu også vise rigtige og forkerte eksempel sætninger
  • API:
  • SentenceTokenizer nu en grænseflade, gennemførelse er blevet flyttet til RegexSentenceTokenizer, men det er forældet og SRXSentenceTokenizer bør anvendes i stedet
  • Nogle metoder fra org.languagetool.tools.StringTools er blevet flyttet til den org.languagetool.gui.Tools klasse i languagetoolguicommons projektet
  • LanguageToolListener.languageToolEventOccured () er blevet omdøbt til LanguageToolListener.languageToolEventOccurred ()
  • org.languagetool.tools.SymbolLocator er ikke offentligt længere (bør ikke påvirke nogen)
  • fjernet DanishSentenceTokenizer som var blevet frarådet i tre år
  • Rule.getCorrectExamples () og Rule.getIncorrectExamples () ikke returnerer null længere, men en tom liste, hvis der ikke er nogen eksempler. Følgelig finder setCorrectExamples () og setIncorrectExamples () ikke acceptere null længere.
  • Rule.getId () kan returnere en streng nu, ikke bare ASCIIonly strings (faktisk dette har været tilfældet før, da ASCIIonly begrænsning aldrig blev håndhævet, og kun nævnt i javadoc)
  • languagetoolwikipedia: kommandolinjeflag til kontrol en Wikipedia dump er blevet forenklet. Kommandoen kan nu kaldes sådan: java jar languagetoolwikipedia.jar checkdata l da f enwiki20130621pagesarticles.xml Ring bare "java jar languagetoolwikipedia.jar checkdata" for at få et forbrug meddelelse. Mere end en fil kan angives med f mulighed. Udover Wikipedia XML lossepladser, CSV-filer fra Tatoeba (http://tatoeba.org) nu også understøttet, de har brug for at blive filtreret første til at indeholde kun de relevante sprog.

Hvad er nyt i version 2.3:

  • bretonsk:
  • tilføjede / forbedrede nogle få regler
  • faste falske alarmer
  • opdateret POS ordbog fra apertium (svn r47282)
  • catalansk:
  • tilføjet støtte til sprogkode ca-ES-valencia (catalansk Valencia), der skal anvendes i LibreOffice 4.2.0
  • tilføjet en simpel erstatte reglen med hundredvis af udskiftning forslag
  • tilføjede / forbedrede flere regler
  • faste falske alarmer
  • kinesisk:
  • tilføjet en løsning for en StringIndexOutOfBoundsException (http://sourceforge.net/p/languagetool/bugs/186/)
  • Engelsk:
  • tilføjede udskiftning mønstre for stavekontrollen til at komme med forslag bedre (tilbyder nu 'lært' for 'undervist')
  • tilføjede / forbedrede nogle få regler
  • fransk:
  • tilføjede / forbedrede nogle få regler
  • faste falske alarmer
  • opdateret POS tag ordbog og Hunspell ordbog til Dicollecte-4.12
  • tysk:
  • tilføjede / forbedrede flere regler
  • portugisisk:
  • tilføjede / forbedrede nogle få regler
  • det nu har 3300+ sammensatte ord
  • ukrainsk:
  • tilføjede / forbedrede flere regler
  • kildekoden er blevet flyttet til GitHub: https://github.com/languagetool-org/languagetool
  • LanguageTool kræver Java 7 nu
  • LanguageTool gør brug af flere tråde nu for tekst kontrol på moderne hardware, forbedre ydeevnen (dette påvirker enkeltstående version, kommandolinjen versionen og LibreOffice / OpenOffice extension)
  • Regel syntaks:
  • foreløbig støtte til nye min / max attributter, der tillader at matche et element, der vises det angivne antal gange. For eksempel: foo vil matche noget eller "foo", dvs "foo" er valgfri foo vil matche "foo" eller "foo foo" foo vil matche ingenting, "foo", eller "foo foo" Brug max = "- 1" at tillade ubegrænset hændelser. For min, kun 0 eller 1 er understøttet (1 er standard).
  • støtte til OR-udsagn. For eksempel: et internt og run-time, en regel, der indeholder eller-erklæringer omdannes til flere regler uden OR-udsagn
  • .
  • engelsk har nu en chunker at opdage, bl.a., ental og flertal navneord bidder. Dette er dokumenteret ved http://wiki.languagetool.org/using-chunks
  • standalone-version:
  • enkeltstående version understreger nu fejl med en rød (stave fejl) eller blå (andre fejl) linje (Panagiotis Minos)
  • Husk sprogvalg for næste start
  • Forbedret vindue og dialog placering i en opsætning med flere skærme
  • embedded server: bruger standard port (8081) igen, hvis i gang uden argumenter
  • opdateret morfologik-stammer bibliotek til version 1.7.1 for at muliggøre bedre forslag, herunder korrekt håndtering af diakritiske tegn og udskiftning mønstre (ækvivalenter MAP og REP funktioner i hunspell ordbøger)
  • OpenOffice / LibreOffice integration:
  • fix: "Om" dialog ikke virkede i Apache OpenOffice 4.0
  • fix: landespecifikke regler (som for britisk engelsk) ikke virkede
  • API:
  • I klassen Language, har getCountryVariants () blevet omdøbt til getCountries (), og en ny metode getVariant er blevet tilføjet.
  • Nogle metoder er blevet frarådet
  • Nogle metoder er blevet flyttet fra den Tools klasse (LanguageTool-core) til nye CommandLineTools klasse (LanguageTool-commandline)










Hvad er nyt i version 2.2:



Hvad er nyt i version 2.1:





Hvad er nyt i version 2.0:







Krav :

  • Java 2 Standard Edition Runtime Environment

Andre software developer Daniel Naber

LanguageTool
LanguageTool

21 Jan 15

Jwordsplitter
Jwordsplitter

21 Jan 15

Kommentarer til LanguageTool

Kommentarer ikke fundet
Tilføj kommentar
Tænd billeder!