Software detaljer:
Det gør den ved at skabe mere end 8 metalinks af TED foredrag varierende i både kvalitetsniveau og mulige talk grupperinger af mappen
Egenskaber :.
- Opretter samtaler med informative filnavne - dvs. Utraditionelle Forklaringer / Hans Rosling om hiv -. Nye fakta og fantastiske data visuals.mp4 stedet for original HansRosling_2009_480.mp4
- forsøger hårdt at få alle de samtaler, eller i hvert fald de fleste af dem -. Med en god grund, hvis nogle har undladt
- Større udvalg -. Skaber en metalink pr tilgængelig kvalitetsniveau (i øjeblikket lav og høj)
- Større udvalg - skaber en metalink pr tilgængelig snak gruppering, med alle samtaler, der tilhører samme koncern placeret inde i et fælles bibliotek. De mulige talk grupperinger er udvundet af samtaler metadata (i øjeblikket filme / publishing år, taler tema og forfatter).
- Aggressiv caching gennem hele projektet, for at undgå dyre netværk / CPU operationer så meget som muligt. Korrekt cache ugyldiggørelse inkluderet.
- Høje niveauer af fejltolerance.
- Enkel, men alligevel kraftfulde hjemmeavlede webcrawler.
- Fleksibel og Extensible software design med ændringer i tankerne.
- Giver både konsollen script og en offentlig API.
Hvad er nyt i denne udgivelse:.
- Blacklistet anden snak URL med ingen downloads
- Opdateret forfatter og video metadata markører som TED opdateret sin HTML layout.
Hvad er nyt i version 2.0.0:
- Feature tilføjelser:
- Fixed problem # 4 - Tilføjet talk undertekster support, som pr utallige opfordringer. Større tak til Randall Mason til den indledende gennemførelse.
- Tilføjet parallelitet til crawler, hvilket fører til væsentlige forbedringer ydeevne.
- Tilføjet filme år, forlagsvirksomhed år og begivenhed navn til samtaler metadata, der automagisk tilføjet nye mulige talk grupperinger.
- Tilføjet parallelitet til Metalink generator, hvilket fører til væsentlige forbedringer ydeevne.
- Fejlrettelser:
- Opdateret snak tema markører som TED opdateret sin HTML layout og forbedret fejlhåndtering.
- Opdateret Video Download markører og downloade URL'er afsløring kode som TED opdateret sin HTML layout.
- Opdateret forfatter markører og detektion kode som TED opdateret sin HTML layout.
- talk_info metadata cache er skrevet til disken så hurtigt som muligt for at minimere tab af data på fejl.
- Fjernet setup.cfg da vi ikke længere har brug for det.
- Fjernet drømmende-trac projekt reference fra LICENS.
- Interne:
- skiftet fra at bruge setuptools at distribuere til emballage.
- Fjernet crawler baseret side caching, da det ikke længere bruges eller behov.
- skiftet fra BeautifulSoup til LXML og fjernet brugerdefinerede crawler kode til fordel for lxml.html.parse.
- Minimal Python-version rumlede fra 2.4+ til 2,6 +.
- Major refactoring at modernisere den eksisterende kodebase, og samtidig forbedre kode stil, optimere ydeevnen og komme af akkumulerede teknisk gæld. Eksisterende API har lidt lidt.
Hvad er nyt i version 1.0.5:
- Opdateret snak tema markører som TED opdateret sin HTML layout .
Hvad er nyt i version 0.1:
- Blacklistet et par snak URL'er, da de ikke har haft eventuelle downloads for et godt stykke tid.
- Opdateret video download markører som TED opdateret sin HTML layout.
Krav :
- Python
Kommentarer ikke fundet