LanguageTool

Skjermbilde programvare:
LanguageTool
Prog.varedetaljer:
Versjon: 2.9 Oppdatert
Last opp dato: 14 Apr 15
Utvikler: Daniel Naber
Lisens: Gratis
Popularitet: 18

Rating: nan/5 (Total Votes: 0)

LanguageTool er en åpen kildekode korrektur program utviklet for å finne feil som vanlige stavekontroll verktøy ikke kan oppdage. Det er et regelbasert stil og grammatikkontrollen som vil finne feil som regel er definert i sine XML konfigurasjonsfiler, for eksempel blande seg & ldquo; sin & rdquo; med & ldquo;. det & rdquo;


Oppdager ulike grammatiske problemer

Programmet kan også gjenkjenne ulike grammatiske problemer og kommer med støtte for over 20 språk, inkludert engelsk, tysk, polsk, fransk, spansk, svensk, gresk, kinesisk, dansk, japansk, islandsk, portugisisk og brasiliansk portugisisk.
I tillegg, har det en lett-å-bruke, enkel og grei grafisk brukergrensesnitt som lar hvem som helst å lime inn tekst som må stavekontrollert. Det kan sjekke teksten i utklippstavlen, tag tekst, klipp / kopier / lim inn tekst, og bor i systemstatusfeltet området.


Oppdager et bredt spekter av problemer

Fra dialogboksen Alternativer, kan du aktivere hvilken type problemer søknaden kan oppdage, inkludert dårlig stil, grammatiske feil, slang, tegnsettingsfeil, mulige skrivefeil, overflødige setninger, ofte forvirrede ord, collocations, kapitalisering, semantikk, samt som ikke er standard setninger.


LanguageTool for Libreoffice og Openoffice

I tillegg til å være et frittstående program, er LanguageTool også tilgjengelig som en forlengelse for to av de mest populære og kraftige åpen kildekode kontorpakker, Libreoffice og Apache OpenOffice.org, slik at brukerne kan korrekturlese sine tekster ved å høyreklikke på utvalgte setninger eller avsnitt.


LanguageTool for Mozilla Firefox

I tillegg er programmet også tilgjengelig for nedlasting som en add-on for verden & rsquo; s mest populære open-source nettleser i verden, Mozilla Firefox. Det krever ingen omstart og plasserer en liten knapp på hovedverktøylinjen, slik at du kan korrekturlese uthevet tekst fra nettsteder eller skjemaer.


Under panseret og tilgjengelighet

Programmet er skrevet i programmeringsspråket Java, noe som betyr at det & rsquo; s kryssplattform programvare, utviklet for å fungere med alle GNU / Linux-distribusjon, samt BSD, Solaris, Microsoft Windows og Mac OS X operativsystem systemer, hvor Java Runtime Environment er installert.

Hva er nytt i denne utgaven:

  • katalansk:
  • oppdatert POS tag ordbok
  • lagt til nye regler
  • faste falske alarmer
  • engelsk:
  • Lagd noen regler og faste noen falske alarmer
  • lagt til mange nye stilregler bidratt med Heikki Lehvaslaiho. Da disse kan føre til falske alarmer, de er ikke aktivert som standard. Du kan aktivere dem ved å slå på alle regler i den nye "Plain English" kategorien.
  • Esperanto:
  • lagt til et par nye regler
  • French
  • oppdatert POS tag ordbok og Hunspell ordliste Dicollecte-5.3
  • tysk:
  • lagt noen nye regler og faste falske alarmer
  • Lagt til en ny regel som sjekker for faget verb avtalen. For nå er det bare saker med 'ist', 'sind "," krig ", og" waren' støttes. Eksempel på feil som er oppdaget: '. Der Hund sind scha & para; n', 'Die Autos ist schnell. For å gjøre denne regelen arbeidet, er fraser nå forenet i disambiguation.xml: for eksempel "Mann" i uttrykket "ein Mann 'vil kun beholde sin nominativ lesing (SUB: NOM: SIN: MAS), mens det pleide å ha også akkusativ og dativ målinger (SUB: AKK: SIN: MAS, SUB: DAT: SIN: MAS). (Https://github.com/languagetool-org/languagetool/issues/233)
  • Italiensk:
  • forbedret noen regler
  • polsk:
  • lagt til flere nye regler
  • portugisisk:
  • lagt / forbedrede flere regler
  • 3695 sammensatte ord (pre-reformen) - den største gratis database
  • Russian:
  • lagt og forbedrede regler
  • ukrainsk:
  • stor ordbok oppdatering
  • nye grammatiske regler
  • ny enkel erstatte regelen for myke forslag
  • disambiguator forbedringer
  • forbedringer forbindelse tagging og stave

  • Forbedringer
  • initialer tagging
  • setning og ord tokenizing forbedringer
  • forbedret håndtering av stres symbol og myk bindestrek
  • Bitext regler:
  • lagt til en enkel regel for å sjekke om oversettelser slutte med det samme skilletegn som originalen (dette inkluderer bare.?! Tegn).
  • er det nå mulig å legge til eksterne bitext regelfilene på kommandolinjen, ved å bruke
  • -bitextrule alternativet. Filbanen må være absolutt. Merk:. Dette gjør at du bruker bitext regler også for språk som ikke har noen bitext regler inkludert som standard
  • Stavekontroll:
  • De nye filene på /hunspell/spelling.txt kan brukes til å legge aksepterte ord til stavekontroll som regnes også når du oppretter forslag for feilstavede ord. Dette ligner på de /hunspell/ignore.txt filer, som liste akseptert ord som * ikke * brukes når du lager forslag for feilstavede ord.
  • API:
  • JLanguageTool.activateDefaultPatternRules () og JLanguageTool.activateDefaultFalseFriendRules () har blitt fjernet - alle mønster regler og falske venner regler (hvis andrespråk er spesifisert) er nå aktivert automatisk når konstruktøren av JLanguageTool kalles. Skulle du trenge en brikke uten XML-baserte mønster regler, utvide språket klassen (for eksempel "engelsk") med en som overskriver de getPatternRules () metoden og returnerer en tom liste der.
  • ManualTagger.lookup () har blitt erstattet av ManualTagger.tag () etter å ha blitt frarådet siden den siste versjonen
  • Alle statiske metoder og felt fra klassen "Språk" er flyttet til den nye klassen "språk". For nå, metodene / felt i klasse Språk eksisterer fortsatt, men har blitt frarådet.
  • LanguageIdentifierTools har blitt fjernet. Bruk LanguageIdentifier i stedet.
  • Fjernet (Standard) ResourceDataBroker.setResourceDir () og setRulesDir () da disse kan settes med konstruktøren
  • Ryddet opp opp klasse bidragsyter, f.eks fjerne getRemark ()
  • Category.setDefaultOff () er fjernet, dette kan settes via konstruktøren nå
  • Omdøpt klasser: o.lt.rules.patterns.Element = & gt; o.lt.rules.patterns.PatternToken o.lt.rules.patterns.ElementMatcher = & gt; o.lt.rules.patterns.PatternTokenMatcher
  • Andre små API opprydding som ikke skal påvirke de vanlige bruksmåter, for eksempel IncorrectExample.getCorrections () returnerer og unmodifiable liste nå, fjerning av nedgraderte metoder.
  • Embedded server:
  • XML rømmer har blitt fikset, kan dette føre til ugyldige XML-dokumenter skal returneres
  • ny konfigurasjonsfil alternativet "maxWorkQueueSize" som lar deg sette den maksimale størrelsen på forespørsel køen - hvis det blir større enn dette, vil forespørsler bli avvist (503 Tjenesten er utilgjengelig)
  • Serveren nå svarer med mer spesifikke HTTP statuskoder til disse feilforhold: 413 Request Entity Too Large - hvis teksten overskrider maksimal tekststørrelse 503 Tjenesten er utilgjengelig - hvis sjekken overstiger maksimums sjekk tid
  • GUI:
  • Den frittstående GUI kan nå ta en ren tekstfil som et argument, vil denne filen så lastes ved oppstart (Github problemet # 232).
  • Command-line:
  • Det er nå mulig å legge til en ekstern regel fil når du ringer LanguageTool fra kommandolinjen. Bruk --rulefile å legge til en fil. Hvis filnavnet har et format som inneholder et språk navn, vil det bli brukt sammen med andre regler; ellers vil den erstatte reglene. Du kan også laste en ekstern fil med falske venner ved hjelp av opsjons --falsefriends. Filnavnet bør være et absolutt filbane, og falske venner filer blir alltid lagt til de som er lastet for språket. (Github problemet # 192)
  • Rule syntaks:
  • En regel kan nå ha et enkelt eksempel setning så lenge den har en "korreksjon" attributt - dette kan spare litt redundans hvis den eneste riktige setningen er det samme som feil setningen med korrigeringen som brukes. Før en regel trengte minst to eksempelsetninger.
  • 'eksempel' element: type = "feil" er nå valgfritt om det er en "korreksjon" attributt. The 'korreksjon' attributt innebærer at dommen er feil.
  • 'eksempel' element: type = "riktig" er nå valgfritt. No 'type' attributt og no 'korreksjon' attributt innebærer at dommen er riktig.
  • Intern:
  • Vi har byttet fra Apache Tika til språk-detektor (https://github.com/optimaize/language-detector) for automatisk å identifisere tekstspråket. Det bør være raskere og resultatene skal være mer pålitelig. Påvisning av Asturias og Galicia måtte bli deaktivert fordi påvisning kvaliteten var for lav, og også påvirket påvisning av spansk.
  • Fikset en regresjon som gjorde det umulig å laste eksterne regelfilene i GUI.

Hva er nytt i versjon 2.8:

  • Asturias:
  • fjernet avhengigheten Hunspell, nå bruker Morfologik til stavekontroll
  • Breton:
  • lagt til og forbedret noen regler
  • katalansk:
  • oppdatert ordbok
  • lagt og forbedrede regler
  • faste falske alarmer
  • nederlandsk:
  • lagt og forbedrede mange regler
  • engelsk:
  • noen nye regler (Takk til Nick Hough)
  • oppdatert taggeren og synthesizer ordbøker, fikse problemet # 202
  • nytt filter som skal brukes for å matche partofspeech av deler av ord, f.eks. I * Dette vil bare holde kamper for ord som begynner med "in", og der delen etter "in" er et adjektiv (POS tag 'JJ'). The 'no: 1' er tegnet posisjon, dvs. her første (og eneste) samsvar kalles
  • .
  • Fransk:
  • lagt til og forbedret noen regler
  • tysk:
  • lagt til og forbedret noen regler
  • polsk:
  • lagt til og forbedret flere regler
  • lagt til og forbedret falske venner med engelsk
  • portugisisk:
  • lagt / forbedrede flere regler
  • spansk:
  • fjernet avhengigheten Hunspell, nå bruker Morfologik til stavekontroll
  • reforma regler fil
  • Lagd flere regler
  • tagalog:
  • fjernet avhengigheten Hunspell, nå bruker Morfologik til stavekontroll
  • streken karakter ("") er et skilletegn nå når tokenizing teksten
  • Russian:
  • lagt og forbedrede regler
  • lagt noen falske venner regler (russisk / engelsk)
  • ukrainsk:
  • mange nye reglene (inkludert avtale med substantiver, tidsuttrykk etc)
  • regel dekning bedring
  • ordbok oppdateringen (store forbedringer for egennavn og vokativ)
  • ny kode og regelen for å advare om alternative stave
  • lagt ordhyppighet informasjonen til å forbedre staveforslag
  • noen nye disambiguator regler
  • Rule Syntax:
  • ... kan nå legges til en rulegroup å påvirke alle reglene for den gruppen
  • Hvis du utvikle dine egne regler som ikke er en del av LT kan du nå legge til eksterne = "ja" til kategorier for å hindre at koblingen regel å community.languagetool.org vises i det frittstående GUI (lenken vil ikke fungere for regler som ikke er en del av hovedfordelingen av LT). (Github problemet # 223)
  • Hvis en regel gruppe angir default = "off", reglene inne regelen gruppen kan ikke også angi standard = "on" / "off".
  • API:
  • Fjernet klasser og metoder som var blitt foreldet siden 2.7 eller lengre
  • Embedded server:
  • konfigurasjonsfilen alternativer 'requestLimit' og 'requestLimitPeriodInSeconds' kan nå også brukes for HTTP-server (ikke bare for HTTPS-server)
  • New konfigurasjonsfil alternativet "trustXForwardForHeader ': sette denne til" true "hvis du kjører server bak en reverse proxy og ønsker anmodning grensen for å arbeide på den opprinnelige IP-adresser som tilbys av' Xforwardedfor 'HTTP header, vanligvis av fullmakten. Hvis du kjører bak en proxy, men ikke angir denne egenskapen til sann, kan én bruker bruke alle forespørsler slik at andre brukere vil også få en feilmelding på grunn av forespørsel grensen.
  • Fix respons etter fristen modus: ... var noen ganger tom, forvirrende teksten innsjekking WordPress
  • Bitext reglene ble ikke deaktivert på riktig måte, selv om de var spesifisert med en riktig parameter for serveren; nå er det fikset
  • Fast problem med feil posisjoner for noen bitext regler (Issue # 218)
  • GUI:
  • har blitt lagt til en ny 'errorColors' innstilling til languagetool.cfg konfigurasjonsfilen. Den kan brukes til å sette bakgrunnsfarge på feil. For eksempel errorColors = typografiske: # b8b8ff, stil: Det vil # ffb8b8 vise 'typografiske' feil med en blå bakgrunn og "stil" feil med rød bakgrunn i den øvre delen av LT vinduet. 'Typografiske "og" stil "er de typene som er satt i grammar.xml som" type = ... ". Det er ingen brukergrensesnitt ennå å konfigurere disse fargene. Merk at du bør bare redigere languagetool.cfg filen når LT ikke kjører.
  • Intern:
  • Bugfix: regler inne regel gruppe ikke hadde blitt aktivert hvis en tidligere regel fra samme rulegroup brukt default = "off"
  • Ord ikke ignoreres lenger av stavekontrollen bare fordi de forekommer i en regel forslag. Hvis du vil at stavekontrollen til å ignorere ord globalt, legge dem til Hunspell / ignore.txt. Å ignorere dem avhengig av sammenhengen, legger en "ignore_spelling regelen til disambiguation.xml.
  • En fil 'Hunspell / prohibit.txt "kan nå brukes til å markere ord som stavefeil, selv om stavekontrollen normalt ville godta dem. Dette er nyttig for å forbedre LanguageTool stavekontrollen uten å vente på oppstrøms kontrolløren å bli oppdatert. The 'prohibit.txt' filen er det motsatte av 'ignore.txt ", som fører til at stavekontrollen til å ignorere ord.
  • partofspeech Taggeren for de fleste språk kan nå utvides ved å legge til oppføringer i filen org / languagetool / ressurs / XX / added.txt (XX er språkkoden). Formatet er "fullform baseform postag", tre kolonner adskilt med faner. Dette gjør det enklere for brukere (og utviklere) å forlenge POS taggeren, som de ikke trenger å eksportere, endre og gjenskape den binære ordbok for hver endring.

Hva er nytt i versjon 2.7:

  • Breton:
  • lagt og forbedrede regler
  • Ny regel som sjekker om en ukedag samsvarer med en dato, for eksempel oppdager "Gwener 28 a nemlig Eost 2014", som denne dato ikke er en fredag.
  • katalansk:
  • lagt og forbedrede regler
  • faste falske alarmer
  • nederlandsk:
  • lagt og forbedrede mange regler
  • byttet til Morfologik basert stavekontroll
  • -Engelsk:
  • Vil du være en del av teamet som utvikler verdens mektigste Open Source korrekturlesing verktøyet? Vi leter etter en vedlikehold for de engelske reglene i LanguageTool. Se http://wiki.languagetool.org/tasks-for-language-maintainers for detaljer.
  • Alle engelske ordbøker har blitt utvidet til å inneholde ordet frekvens klasser for å forbedre forslag fra stavekontroll (frekvensen data er hentet fra https://github.com/mozilla-b2g/gaia/tree/master/apps/keyboard/js / IME / latin / ordbøker, som for andre språk som allerede bruker denne funksjonen).
  • Bedre forslag til engelske elever: uregelmessige verb, substantiv og adjektiv nå har vanligvis et bedre forslag. For eksempel "thinked 'tyder' trodde ',' womans 'antyder" kvinner ".
  • Flere feilstavelser gi forslag nå, for eksempel 'Garentee' (garanti), 'takknemlig' (takknemlig). Dette kan redusere ytelsen på ~ 10% (mer for tekster med mye ukjente ord).
  • Ny regel som sjekker om en ukedag samsvarer med en dato, for eksempel oppdager "Monday, 7 oktober 2014", som denne dato ikke er en mandag. Denne regelen vil bare fungere hvis den oppdager datoformatet i bruk. Så langt er disse formatene støttes: * "Mandag, 7 oktober 2014" * "Monday, 7 oktober 2014" * "Monday, 7 oktober 2014" * "Monday, 7 oktober 2014" (dette fungerer også med forkortet uke dager som Mo eller man for mandag)
  • Esperanto:
  • Ny regel som sjekker om en ukedag samsvarer med en dato, for eksempel oppdager "Vendredon la 28-an de AAgusto 2014", som denne dato ikke er en fredag.
  • Fransk:
  • oppdatert POS tag ordbok og Hunspell ordliste Dicollecte-5.2
  • lagt en synthesizer - avtalen regelen kan nå komme med forslag for noen feil
  • lagt / forbedrede flere regler
  • Ny regel som sjekker om en ukedag samsvarer med en dato, for eksempel oppdager "vendredi 28/08/2014", som denne dato ikke er en fredag.
  • tysk:
  • Fikset en sjelden NullPointerException og en ArrayIndexOutOfBoundsException
  • Faste flere falske alarmer
  • Lagd og forbedrede regler
  • Ny regel som sjekker for setninger uten et verb (standard slått av på grunn av risikoen for falske alarmer)
  • Ny regel som sjekker om en ukedag samsvarer med en dato, for eksempel oppdager "Dienstag, 29.9.2014", som denne dato ikke er en tirsdag.
  • Ytelsesforbedringer for stavekontroll forslag
  • persisk:
  • lagt innledende støtte for persisk (farsi)
  • polsk:
  • lagt til og forbedret noen regler
  • ny regel som sjekker om en ukedag matcher en dato
  • portugisisk:
  • lagt / forbedrede flere regler
  • lagt til mange titalls sammensatte ord
  • Russian:
  • lagt til nye regler
  • fikse SourceForge funksjonen forespørsel # 38 (sjekk for ulike anførselstegn)
  • lagt noen falske venner regler (russisk / engelsk)
  • ny regel som sjekker om en ukedag samsvarer med en dato, for eksempel detekterer "ÐонеÐ'еÐ"NŒÐ½Ð¸Ðº, 30 N ?? & ETH; & micro, og ETH; & frac12; N & sbquo N ?? & ETH; & plusmn N & euro; N ?? 2014 og ETH; & sup3 ;. ", som denne dato ikke er en mandag
  • .
  • utvidet russiske sammensatt regel med nye ord fra postag ordbok
  • spansk:
  • Lagt til nye POS kategori Z (for stavet tall, for eksempel 'uno', 'dos', ...)
  • spelt tall kan nå oppdages og håndteres både i disambiguation og regler.
  • Fikset noen feil lemma i POS ordbok.
  • Lagt Hybrid chunker-disambiguator.
  • Tamil:
  • Lagt innledende støtte for Tamil. Hvis skriften for Tamil ikke er riktig vises på datamaskinen, og du bruker Windows, må du kanskje bruke omgå beskrevet her: https://bugs.openjdk.java.net/browse/JDK-8008572
  • ukrainsk:
  • store oppdateringen for POS ordbok (rettinger og nye ord)
  • noen POS tag omdøpt for konsistens; nye koder for forkortelser og sjeldne ord
  • mange nye regler og feilrettinger for eksisterende regler
  • ny regel som sjekker om en ukedag samsvarer med en dato, for eksempel oppdager "og ETH, og ETH; & frac34; & ETH; & frac12; & ETH; & micro, og ETH; 'N & ETH," og ETH; & frac34; & ETH; & ordm ;, 7 & ETH; & para; & ETH; & frac34; & ETH; & sup2; 2014 ", som denne dato ikke er en mandag
  • token normalisering ytelsesforbedring
  • Libreoffice integrering:
  • Ikke bli forvirret av fotnoter i Libreoffice 4.3 og senere (det nå gir oss fotnote stillinger som metadata, slik at vi kan ignorere dem).
  • API:
  • Store ytelsesforbedringer for flertråd use case, hvor JLanguageTool blir opprettet per tråd, men språket objekt (f.eks 'tysk') blir opprettet bare én gang. Overhead for å skape JLanguageTool skal nå være mye lavere.
  • Fjernet flere klasser og metoder som var blitt foreldet siden versjon 2.6
  • Fjernet DutchSpellerRule - bruk MorfologikDutchSpellerRule stedet
  • underskrift Language.getRelevantRules () har endret
  • De JLanguageTool og MultiThreadedJLanguageTool konstruktører ikke erklære å kaste en IOException lenger
  • WhitespaceRule har blitt omdøpt til MultipleWhitespaceRule (WhitespaceRule fortsatt eksisterer, men har blitt foreldet)
  • Utdatert noen metoder som synlighet vil bli redusert (f.eks fra offentlig til beskyttede)
  • MorfologikSpellerRule.getRuleMatch (String, int) har endret navn til MorfologikSpellerRule.getRuleMatches (String, int)
  • RuleMatch konstruktøren kaster nå et unntak hvis toPosition er ikke større enn fromPosition
  • Innført en ny abstrakt klasse TextLevelRule som strekker regel og som kan brukes for regler som dekker mer enn enkle setninger.
  • Command line:
  • Aktivere og deaktivere spesifikke regler på samme tid er nå tillatt. For å teste bare noen regler (invalid resten), som tidligere ble gjort med "enable LIST_OF_RULES", nå bruke "--enabledonly enable LIST_OF_RULES" (eller "-eo -e LIST_OF_RULES").
  • Embedded server:
  • To nye alternativer kan settes i egenskapsfilen for å gjøre LanguageTool returnere samme XML-format som etter fristen (ATD). På denne måten kan den brukes som en drop-in erstatning for ATD: * -modus - 'LanguageTool' eller 'AfterTheDeadline' * afterTheDeadlineLanguage - etiske standard språk hvis modus er satt til 'AfterTheDeadline' MERK: 'AfterTheDeadline "-modus bør vurderes eksperimentell for nå.
  • Det nye alternativet 'maxCheckThreads' kan du stille inn det maksimale antall tråder som arbeider på forespørsler i parallell. Standard er 10, som det pleide å være.
  • Internals:
  • New abstrakt regel AbstractDateCheckFilter som gjør det mulig å kontrollere om en ukedag og dato kamp. For eksempel «Tirsdag, 29 september 2014" kunne påvises, som 29. september er 2014 faktisk ikke en tirsdag. Dette bruker ny eksperimentell RuleFilter grensesnitt som kan kalles fra XML med den nye "filter" element. 'Filter' tar disse attributtene: "class": den fullstendige navnet på en Java-klasse som implementerer RuleFilter, f.eks "org.languagetool.rules.de.DateCheckFilter" 'args': En streng som "år: 1 måned: 2 day: 3 ukedag: 4", dvs. en space-separert liste av nøkkel / verdi-par, der x blir løst til mønsteret er token verdi (som i 'melding' element)
  • Den sammensatte regel ignorerer nå tokens som har blitt vaksinert i disambiguation.xml
  • "filter" handling i disambiguator brukes nå kun til POS-koder som samsvarer med POS tag gitt. Hvis de ikke stemmer overens, er regelen ikke brukt.
  • Hvis du utvide XML-regler som beskrevet i http://wiki.languagetool.org/tips-and-tricks#toc2, de eksterne regelen og Pekere filer kan nå være lagret på en passordbeskyttet server ved å angi en URL som dette: http: // user: password@example.org/path/user-rules.xml
  • Den tankestrek ("a & euro;" ") er nå en tokenizing karakter for alle språk
  • Ny funksjon:
  • Bruk av språkmodeller
  • LanguageTool kan nå benytte seg av Ngram data. Ngram data er informasjon om hvor ofte setninger oppstå i et språk. Foreløpig bruker denne setninger av lengde 3.
  • Den informasjonen blir brukt av en engelsk regel å finne homofon feil, som å blande opp grov / kurs eller teft / bluss. LanguageTool hadde noen regler av denne typen før, men den nye regelen støtter nå ca 900 slike ordpar / settene.
  • er data som trengs for denne enorme (7 GB for engelsk), og dermed ikke en del eller LanguageTool.
  • De data (bare på engelsk for nå) og mer dokumentasjon er tilgjengelig på http://wiki.languagetool.org/finding-errors-using-big-data
  • Bruk ngrams gjør LanguageTool litt tregere når dataene er lagret på en SSD.
  • Hvis ikke er lagret på en SSD, kan ytelsen drastisk redusert.
  • Bruk den nye --languagemodel alternativet med kommandolinjeklienten for å aktivere regelen som bruker dataene. Det valget er ennå ikke tilgjengelig for frittstående GUI.

Hva er nytt i versjon 2.4.1:

  • Oppdatert Morfologik bibliotekene til 1.8.3 for å fikse treg forslag i stavekontrollen, som rammet minst en-US

Hva er nytt i versjon 2.4:

  • Breton:
  • SRX setning tokenization
  • tilsatt / forbedret noen regler
  • faste noen falske alarmer
  • fast uriktige forslag takket være lagt tester på korreksjoner
  • katalansk:
  • lagt / forbedrede flere regler
  • faste falske alarmer
  • gjort tilføyelser og rettelser til taggeren ordbok
  • fjernet noen ord fra syntese ordbok (se filterarchaic.txt)
  • lagt frekvensdata til taggeren ordbok; frekvens ordliste kommer fra Gaia-prosjektet, med Apache License, versjon 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
  • engelsk:
  • tilsatt / forbedret noen regler
  • faste noen falske alarmer
  • Fransk:
  • lagt / forbedrede flere regler
  • faste noen falske alarmer
  • tysk:
  • lagt / forbedrede flere regler
  • lagt en synthesizer avtalen regelen kan nå komme med forslag for noen feil (ikke alle forslagene er riktige, men)
  • polsk:
  • tilsatt / forbedrede flere regler, spesielt for bindestrek og dash bruk
  • lagt til informasjon frekvens for stavekontroll ordbok; frekvens ordliste kommer fra Gaia-prosjektet, med Apache License, versjon 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
  • faste noen falske alarmer
  • portugisisk:
  • tilsatt / forbedrede flere regler (det inkluderer nå kjønnsregler "a" / "o")
  • det nå har 3400+ sammensatte ord
  • JAR-filen har blitt omdøpt til languagetool.jar, fra tidligere languagetoolstandalone.jar å unngå forvirring om hva "frittstående" betyr i denne sammenhengen (github problemet # 29)
  • for språk med mange regler (som fransk eller tysk) ytelse på lange tekster er økt med ca 2030%
  • fix for threadsafety (kunne føre henge i MultiWordChunker)
  • fikset en bug der chunk merknader ikke ble testet i grupper
  • fix: 1, og hadde ikke blitt evaluert i ...
  • fikset en bug i foreningen mekanisme som forkastet noen av de samsvarende tolkninger tidlig
  • lagt til støtte for chunk merknader i disambiguator, og fikset en bug i filtrerings tokens med klump merknader
  • oppdaterte Morfologik bibliotekene til 1.8.2 (feilrettinger strengere innspill tilregnelighet sjekker, legge frekvensdata til ordbøker)
  • lagt mulighet for blant annet frekvens data til taggging eller staving ordbøker. Den forventede formatet av frekvens ordlistene er den i Gaia-prosjektet, med Apache License, versjon 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries)
  • nye kommandolinje verktøy for å eksportere og lage binære ordbøker:
  • org.languagetool.dev.DictionaryExporter
  • org.languagetool.dev.POSDictionaryBuilder
  • Libreoffice / Openoffice integrering:
  • lagt en midlertidig løsning for feil setning deteksjon for det tilfellet at en fotnote dukket opp etter en setning punktum (Sourceforge bug # 191)
  • stående GUI:
  • Dialogboksen åpnes av "More ..." element i hurtigmenyen for en feil vil nå også vise riktige og feil setningseksempler
  • API:
  • SentenceTokenizer er nå et grensesnitt, gjennomføring har blitt flyttet til RegexSentenceTokenizer, men dette er foreldet og SRXSentenceTokenizer bør brukes i stedet
  • Noen metoder fra org.languagetool.tools.StringTools har blitt flyttet til org.languagetool.gui.Tools klassen i languagetoolguicommons prosjektet
  • LanguageToolListener.languageToolEventOccured () har blitt omdøpt til LanguageToolListener.languageToolEventOccurred ()
  • er org.languagetool.tools.SymbolLocator ikke offentlig lenger (skal ikke påvirke noen)
  • fjernet DanishSentenceTokenizer som hadde blitt frarådet i tre år
  • Rule.getCorrectExamples () og Rule.getIncorrectExamples () ikke returnerer null lenger enn en tom liste hvis det ikke er noen eksempler. Derfor trenger setCorrectExamples () og setIncorrectExamples () ikke aksepterer null lenger.
  • Rule.getId () kan returnere en streng nå, ikke bare ASCIIonly strenger (faktisk dette har vært tilfelle før, da ASCIIonly restriksjonen ble aldri håndhevet og bare nevnt i javadoc)
  • languagetoolwikipedia: kommandolinjealternativene for å sjekke en Wikipedia dump har blitt forenklet. Kommandoen kan nå kalles slik: java jar languagetoolwikipedia.jar checkdata l no f enwiki20130621pagesarticles.xml Ring bare "java jar languagetoolwikipedia.jar checkdata" for å få en bruk meldingen. Mer enn én fil kan spesifiseres med f alternativet. I tillegg til Wikipedia XML dumper, CSV-filer fra Tatoeba (http://tatoeba.org) er nå støttes også, de trenger å bli filtrert første til å inneholde kun det aktuelle språket.

Hva er nytt i versjon 2.3:

  • Breton:
  • tilsatt / forbedret noen regler
  • faste falske alarmer
  • oppdatert POS ordbok fra Apertium (svn r47282)
  • katalansk:
  • lagt til støtte for språkkoden ca-ES-valencia (katalansk Valencia), som skal brukes i Libreoffice 4.2.0
  • lagt en enkel erstatte regel med hundrevis av erstatnings forslag
  • lagt / forbedrede flere regler
  • faste falske alarmer
  • kinesisk:
  • lagt en midlertidig løsning for et StringIndexOutOfBoundsException (http://sourceforge.net/p/languagetool/bugs/186/)
  • engelsk:
  • lagt erstatning mønstre for stavekontrollen til å komme med forslag bedre (tilbyr nå "lært" for "undervist ')
  • tilsatt / forbedret noen regler
  • Fransk:
  • tilsatt / forbedret noen regler
  • faste falske alarmer
  • oppdatert POS tag ordbok og Hunspell ordliste Dicollecte-4.12
  • tysk:
  • lagt / forbedrede flere regler
  • portugisisk:
  • tilsatt / forbedret noen regler
  • det nå har 3300+ sammensatte ord
  • ukrainsk:
  • lagt / forbedrede flere regler
  • kildekoden har blitt flyttet til github: https://github.com/languagetool-org/languagetool
  • LanguageTool krever Java 7 nå
  • LanguageTool gjør bruk av flere tråder nå for tekst sjekke på moderne maskinvare, bedre ytelse (dette påvirker den frittstående versjon, kommandolinje versjon og Libreoffice / Openoffice extension)
  • Rule syntaks:
  • foreløpig støtte for nye min / maks attributter som gjør det mulig å matche et element som vises gitt antall ganger. For eksempel: foo vil matche ingenting eller "foo", dvs. "foo" er valgfritt foo vil matche "foo" eller "foo foo" foo vil matche ingenting "foo", eller "foo foo" Bruk max = "- 1" å tillate ubegrenset forekomster. For min, bare 0 eller 1 er støttet (1 er standard).
  • støtte til SV-uttalelser. For eksempel: et internt og i run-time, en regel som inneholder eller-uttalelser blir omdannet til flere regler uten eller-uttalelser
  • .
  • Norwegian har nå en chunker å oppdage, blant andre, entall og flertall substantiv biter. Dette er dokumentert ved http://wiki.languagetool.org/using-chunks
  • stående versjon:
  • Den frittstående versjonen nå understreker feil med en rød (stavefeil) eller blå (andre feil) linje (Panagiotis Minos)
  • Husk språkvalget for neste start
  • Forbedret vindu og dialog plassering i en multi-monitor oppsett
  • innebygd server: bruker standard port (8081) igjen hvis den startes uten argumenter
  • oppdatert morfologik-stemming bibliotek til versjon 1.7.1 for å muliggjøre bedre forslag, herunder forsvarlig håndtering av diakritiske tegn og utskifting mønstre (ekvivalenter av MAP og REP funksjoner i Hunspell ordbøker)
  • Openoffice / Libreoffice integrering:
  • fix: "Om" dialog ikke fungerte i Apache Openoffice 4.0
  • fix: landsspesifikke regler (som for britisk engelsk) ikke fungerte
  • API:
  • I klassen Språk, har getCountryVariants () blitt omdøpt til getCountries (), og en ny metode getVariant har blitt lagt til.
  • Noen metoder har blitt frarådet
  • Noen metoder har blitt flyttet fra Verktøy-klasse (languagetool-core) til den nye CommandLineTools klasse (languagetool-kommandolinja)










Hva er nytt i versjon 2.2:



Hva er nytt i versjon 2.1:





Hva er nytt i versjon 2.0:







Krav :

  • Java 2 Standard Edition Runtime Environment

Annen programvare fra utvikleren Daniel Naber

LanguageTool
LanguageTool

21 Jan 15

Jwordsplitter
Jwordsplitter

21 Jan 15

Kommentarer til LanguageTool

Kommentarer ikke funnet
Legg til kommentar
Slå på bilder!