Software detaljer:
Version: 0.99999 / 1.0b3
Upload dato: 12 May 15
Licens: Gratis
Popularitet: 201
Det følger den oprindelige WHATWG officielle HTML5-specifikationen.
Den parser er designet til at håndtere alle varianter af HTML og analyserer ugyldige dokumenter ved hjælp veldefinerede fejlhåndtering regler er forenelige med opførslen af store desktop webbrowsere.
Udgangen palced inde i en træstruktur.
Det understøtter output til ElementTree, DOM og LXML træ formater samt en simpel brugerdefineret format.
HTML5Lib er pakket med distutils.
HTML5Lib findes også på:
Ruby - download HTML5Lib for Ruby her .
Python - download HTML5Lib for Python her .
PHP - download HTML5Lib til PHP her
Hvad er nyt i denne udgivelse:
- parser. gyldige og ugyldige HTML-dokumenter til et træ
- Støtte til minidom, ElementTree (herunder cElementTree og lxml.etree), BeautifulSoup (forældet) og brugerdefinerede simpletree output formater
- DOM til SAX converter
- Rapporter parse fejl
- Tegnsæt detektering
- Filtrering og Fortløbende træer
- HTML + CSS sanitizer
- Mange unit test
Kommentarer ikke fundet