MDP (Modular toolkit til Data Processing) er et bibliotek med udbredte databehandling algoritmer, der kan kombineres i henhold til en rørledning analogi til at bygge mere komplekse databehandling software.
Fra brugerens synspunkt, MDP består af en samling af overvågede og ukontrollerede læring algoritmer og andre databehandling enheder (noder), der kan kombineres til databehandling sekvenser (strømme) og mere komplekse foder-forward netværk arkitekturer. Givet et sæt af inputdata, MDP tager sig af hinanden uddannelse eller udføre alle noder i netværket. Dette giver brugeren mulighed for at angive komplekse algoritmer som en række simplere databehandling trin på en naturlig måde.
Bunden af tilgængelige algoritmer er støt stigende og omfatter, for blot at nævne de mest almindelige, Principal Component Analysis (PCA og NIPALS), flere uafhængige Component Analysis algoritmer (CuBICA, FastICA, TDSEP, JADE, og XSFA), Slow Feature Analysis, Gauss klassificører, Begrænset Boltzmann Machine, og lokalt Linear Indlejring.
Er taget særlig omhu at gøre beregninger effektive med hensyn til hastighed og hukommelse. For at reducere kravene hukommelse, er det muligt at udføre læring ved hjælp af partier af data, og at definere de interne parametre knudepunkter for at være single præcision, der gør brug af meget store datasæt muligt. Desuden er »parallelle« underpakker tilbyder en parallel gennemførelse af de grundlæggende noder og strømme.
Fra udvikleren perspektiv, MDP er en ramme, der gør implementering af nye algoritmer overvåget og ukontrollerede læring let og ligetil. Den grundlæggende klasse, "Node", tager sig af kedelige opgaver som numerisk type og dimensioner kontrol, forlader udvikleren fri til at koncentrere sig om gennemførelsen af læring og udførelse faser. På grund af den fælles grænseflade, knudepunktet derefter automatisk integreres med resten af biblioteket og kan anvendes i et netværk sammen med andre knudepunkter. En node kan have flere uddannelse faser og endda et ubestemt antal faser. Dette giver mulighed for gennemførelse af algoritmer, der har brug for at indsamle nogle statistikker på hele input, før du fortsætter med den faktiske uddannelse, og andre, der har brug for at gentage over en uddannelse fase, indtil en konvergens kriterium er opfyldt. Evnen til at træne hver fase ved hjælp af bidder af input data bevares, hvis klumper genereres med iteratorer. Desuden nedbrud opsving er fås: i tilfælde af svigt, er den aktuelle tilstand af strømmen gemmes til senere inspektion.
MDP er blevet skrevet i forbindelse med teoretisk forskning i neurovidenskab, men det er blevet designet til at være nyttigt i enhver sammenhæng, hvor der anvendes trainable databehandling algoritmer. Sin enkelthed på brugerens side sammen med genbrugelighed af de gennemførte noder gør det også et gyldigt pædagogisk værktøj
Hvad er nyt i denne udgivelse:.
- Python 3 support.
- Nye udvidelser: caching og gradient .
- En forbedret og udvidet tutorial.
- Flere forbedringer og fejlrettelser.
- Denne udgivelse er under en BSD-licens.
Hvad er nyt i version 2.5:
- 2009-06-30: Tilføjet online detektion af numerisk backend , parallel python support, symeig backend og numerisk backend til udgangen af unit test. Skulle hjælpe i debugging.
- 2009-06-12:. Integration af cutoff og histogram noder
- 2009-06-12:. Fixed bug i parallel flow (exception handling)
- 2009-06-09: Fixed bug i LLENode når output_dim er en float. Tak til Konrad Hinsen.
- 2009-06-05:. Faste bugs i parallel flow for flere opgavestyringsprogrammer
- 2009-06-05:. Rettet en fejl i lag omvendt, takket være Alberto Escalante
- 2009-04-29:. Tilføjet en LinearRegressionNode
- 2009-03-31: PCANode ikke klage længere, når kovariansmatrix har negative egenværdier IFF SVD == Sandt eller reducere == sandt. Hvis output_dim er blevet specificeret har en ønsket varians, er negative egenværdier ignoreret. Forbedret fejlmeddelelse for SFANode i tilfælde af negative egenværdier, vi nu foreslår skal tilføjes i begyndelsen node med en PCANode (SVD = True) eller PCANode (reducere = True).
- 2009-03-26: migreret fra gamle tråd pakke til den nye gevind én. Tilføjet flag for at deaktivere caching i processen scheduler. Der er nogle bryde ændringer for brugerdefinerede planlæggere (parallel flow uddannelse eller udførelse påvirkes ikke).
- 2009-03-25:. Tilføjet svn revision sporing support
- 2009-03-25: Fjernet copy_callable flag for scheduler, det er nu helt erstattet af forgrenede tilknytning af TaskCallable. Dette har ingen virkning for den bekvemme ParallelFlow interface, men tilpassede planlæggere får brudt.
- 2009/03/22:. Gennemført caching i ProcessScheduler
- 2009-02-22:. Make_parallel nu arbejder helt in-sted at spare hukommelse
- 2009-02-12:. Tilføjet container metoder til FlowNode
- 2009-03-03:. Tilføjet CrossCovarianceMatrix med test
- 2009-02-03:. Tilføjet IdentityNode
- 2009-01-30:. Tilføjet en hjælpefunktion i hinet til direkte at vise en flow HTML repræsentation
- 2009-01-22:. Tillad output_dim i Lag, der skal indstilles dovent
- 2008-12-23:. Tilføjet total_variance til nipals noden
- 2008-12-23:. Indstil altid explained_variance og total_variance efter træning i PCANode
- 2008-12-12: Modificeret symrand til virkelig returnere symmetriske matricer (og ikke kun positive konkret). Tilpasset GaussianClassifierNode at tage højde for det. Tilpasset symrand også at vende tilbage komplekse hermitian matricer.
- 2008-12-11: Fast et problem i PCANode (når output_dim blev sat til at input_dim den samlede varians blev behandlet som ukendte). Fast var_part parameter i ParallelPCANode.
- 2008-12-11:. Tilføjet var_part funktion til PCANode (filter ifølge varians i forhold til absoute varians)
- 2008-12-04: Fast mangler akse arg i Amax opkald tutorial. Tak til Samuel John!
- 2008-12-04: Ordnede tomme data iterator håndtering i ParallelFlow. Også tilføjet tomme Iterator kontrol i den normale Flow (hæve en undtagelse, hvis den iterator er tom).
- 2008-11-19: Modificeret PCA og SFA knudepunkter for at tjekke for negaive egenværdier i COV matricer
- 2008-11-19: symeig integreret i scipy, MDP kan bruge den derfra nu .
- 2008-11-18:. Tilføjet ParallelFDANode
- 2008-11-18:. Opdateret toget konverterbare for ParallelFlow at støtte yderligere argumenter
- 2008-11-05: omskrivning af make parallel kode, understøtter nu hinet strukturer .
- 2008-11-03: omskrivning af hinet HTML repesentation skaberen. Desværre er dette også bryder den offentlige interface, men ændringerne er ret enkle.
- 2008-10-29: Luk advarsler, der kommer fra fjerntliggende processer i ProcessScheduler
- 2008-10-27:. Rettet problem med at overskrive kwargs i init metode ParallelFlow
- 2008-10-24:. Fixed pretrained noder fejl i hinet.FlowNode
- 2008-10-20:. Fast kritisk import bug parallelt pakke når pp (parallel python-bibliotek) er installeret
Krav :
- Python
- NumPy
- SciPy
Kommentarer ikke fundet