DSTK - Data Science Toolkit 3 er et sæt data- og tekstgruveprogrammer, der følger CRISP DM-modellen. DSTK tilbyder dataforståelse ved hjælp af statistisk og tekstanalyse, dataforberedelse ved hjælp af normalisering og tekstbehandling, modellering og evaluering til maskinindlæring og statistiske læringsalgoritmer.
DSTK 3 vil tilbyde attraktive funktioner som Deep Neural Network (Deep Learning), Tekst Link Analyse med Visualiseringer, KMeans Clustering. Nogle af disse funktioner kan præsenteres i ældre version, men fordi algoritmerne omskrives for at reducere brugen af eksterne biblioteker som Weka for at reducere filstørrelsen, har vi brug for mere tid til at udvikle dem. DSTK Engine er stadig i beta-fase, derfor kan der være nogle fejl og unøjagtighed.
DSTK 3 består af DSTK Engine, DSTK ScriptWriter, DSTK Studio og DSTK Text Explorer. DSTK Engine er R forenklet med fokus på data mining. DSTK ScriptWriter tilbyder GUI til at skrive script til DSTK Engine. DSTK Studio tilbyder SPSS-statistik som GUI til data mining, og DSTK Text Explorer tilbyder GUI til tekstmining.
Krav :
Java Runtime Environment, Microsoft. Net Framework
Begrænsninger :
10-brugs forsøg
Kommentarer ikke fundet