Software detaljer:
Designet som en wrapper omkring LXML, det nu udvider LXML med alle de funktioner, der normalt er brug for i HTML data mining
Egenskaber :.
- Generelle egenskaber:
- Dejligt jQuery-lignende CSS selektorer
- Enkel adgang til element attributter
- nem måde for konvertere HTML til andet format (BBcode, Markdown osv)
- par nice funktioner til arbejdet med tekst
- Gemmer alle oprindelige funktioner i LXML
- Funktioner for at arbejde med ren tekst:
- to_unicode - Konverter string til Unicode-streng
- strip_accents - Strip accenter fra en streng
- strip_symbols - Strip grimme Unicode symboler fra en streng
- strip_spaces - Strip overskydende mellemrum fra en streng
- strip_linebreaks - Strip overskydende linjeskift fra en streng
Krav :
- LXML
Kommentarer ikke fundet