WordTabulator er beregnet for tekstanalyse. Med hjelp av wordTabulator kan du generere indeks av ordet elementer hentet fra definert tekst sett. Word-elementer kan være ord, N-gram (av definert størrelse) eller setninger (syntagmes). Programmet kan behandle tekster som i vanlige 2-byte koder (ANSI), som i multibyte UTF-8-koding. Kildetekster er definert som et sett av flate tekstfiler eller HTML / XML / SGML-dokumenter. I det siste tilfellet kan programmet filtrere innhold fra markering. Videre kan du behandle bare definert innhold innenfor utvalgte sammenkoblede koder. Eller du kan hoppe over at innhold fra behandlingen. Det inkluderer morfologi modulen for russiske, tre forskjellige formater av produksjonen indeksen, tre forskjellige typer ord elementer (ord, N-Grams og setninger), nettleser av sammenheng, og sann alfabetisk bestilling.
Prog.varedetaljer:
Versjon: 3.5
Last opp dato: 15 Apr 15
Lisens: Gratis
Popularitet: 370
Størrelse: 2708 Kb
Kommentarer ikke funnet