DSTK - Data Science Toolkit 3 er et sett med data og tekst mining programvare, etter CRISP DM modellen. DSTK tilbyr dataforståelse ved hjelp av statistisk og tekstanalyse, dataforberedelse ved hjelp av normalisering og tekstbehandling, modellering og evaluering for maskinlæring og statistiske læringsalgoritmer.
DSTK 3 vil tilby attraktive funksjoner som Deep Neural Network (Deep Learning), Text Link Analysis med visualiseringer, KMeans Clustering. Noen av disse funksjonene kan presenteres i eldre versjon, men fordi algoritmene er omskrevet for å redusere bruken av eksterne biblioteker som Weka for å redusere filstørrelsen, trenger vi mer tid til å utvikle dem. DSTK Engine er fortsatt i betaplan, derfor kan det være noen feil og unøyaktighet.
DSTK 3 består av DSTK Engine, DSTK ScriptWriter, DSTK Studio og DSTK Text Explorer. DSTK Engine er R forenklet, med fokus på data mining. DSTK ScriptWriter tilbyr GUI for å skrive skript for DSTK Engine. DSTK Studio tilbyr SPSS Statistikk som GUI for data mining, og DSTK Text Explorer tilbyr GUI for Text Mining.
Krav :
Java Runtime Environment, Microsoft. Net Framework
Begrensninger :
10-brukers prøve
Kommentarer ikke funnet