lxml

Software screenshot:
lxml
Software detaljer:
Version: 3.4.1
Upload dato: 17 Feb 15
Udvikler: Martijn Faassen
Licens: Gratis
Popularitet: 12

Rating: nan/5 (Total Votes: 0)

LXML er en sofistikeret, kraftfuld, gratis og unik Python-modul, der binder libxml2 og LibXSLT biblioteker, så Python udviklere til at arbejde med både XML og HTML-filer insider deres Python code.An XML forarbejdning librarylxml er et XML (Extensible Markup Language ) forarbejdning bibliotek skrevet i programmeringssproget Python, specielt designet til at følge ElementTree API specifikationen så meget som muligt.
Det kan forlænge ElementTree API til at afsløre specifik funktionalitet LibXSLT og libxml2 biblioteker, såsom Relax NG (Next-Generation), XPath, XML Schema, c14n, XSLT (Extensible Stylesheet Language), at etc.Use LXML kalde Python kode fra XSLT stylesheetsDevelopers vil kunne bruge LXML program til at ringe til Python kode fra XSLT stylesheets og XPath udtryk via forlængerledninger funktioner. En bred vifte af tutorials er tilgængelige på projektets & rsquo; s hjemmeside (se link i slutningen af ​​artiklen).
Softwaren er open source ved design og kombinerer funktionen fuldstændighed og hastigheden af ​​de førnævnte biblioteker med enkelheden i Python & rsquo; s API (Application Programming Interface) .Getting startede med lxmlIt er ganske let at installere LXML på en GNU / Linux-distributionen ved hjælp af kilde arkivet distribueres på Softoware og projektet & rsquo; s officielle hjemmeside. Du skal blot downloade kilden pakken, gemme det på dit hjemmebibliotek, pakker ud, åbn Terminal app og navigere til placeringen af ​​de udpakkede arkiv filer (f.eks cd /home/softoware/lxml-3.4.1).
Kør & lsquo; gøre & rsquo; kommandoen til at kompilere programmet, som bør tage omkring 1-2 minutter på en moderne computer. Efter en vellykket indsamling, skal du køre & lsquo; make install & rsquo; kommando som root eller & lsquo; sudo make install & rsquo; kommando som en privilegeret bruger til at installere LXML systemet wide.Supports GNU / Linux og Microsoft Windows-operativsystemet systemsThe software er offentligt støttede på GNU / Linux og Microsoft Windows-operativsystemer. Det er blevet testet med succes på 32-bit og 64-bit computere

Hvad er nyt i denne udgivelse:.

  • Features tilføjede:
  • Ny htmlfile HTML generator til at ledsage den trinvise xmlfile serialisering API. Patch af Burak Arslan.
  • Bugs fast:
  • lxml.sax.ElementTreeContentHandler ikke initialisere sin overklasse.

Hvad er nyt i version 3.3.1:

  • Bugs fast:
  • LP # 1014290: HTML-dokumenter parsede med parser.feed () undladt at finde elementer under tag iteration
  • .
  • LP # 1273709: Building i PYPY mislykkedes på grund af manglende støtte til PyUnicode_Compare () og PyByteArray _ * () i PYPY s C-API
  • .
  • LP # 1274413: Compilation i MSVC mislykkedes på grund af manglende & quot; stdint.h & quot; standard header fil.
  • LP # 1274118: iterparse () undladt at fortolke BOM foranstillet filer
  • .

Hvad er nyt i version 3.0 Alpha 2:

  • funktioner tilføjet:
  • .iter () metode elementer accepterer nu tag argumenter som & quot; {*} navn & quot; at søge efter elementer med en given lokal navn i enhver navnerum. Med denne tilføjelse, alle kombinationer af wildcards nu som forventet: & quot; {ns} navn & quot ;, & quot; {} navn & quot ;, & quot; {*} navn & quot ;, & quot; {ns} * & quot ;, & quot; {} * & quot; og & quot; {*} * & quot ;. Bemærk at & quot; navn & quot; svarer til & quot; {} navn & quot ;, men & quot; * & quot; er & quot; {*} * & quot ;. Samme ændring gælder for .getiterator (), .itersiblings () .iterancestors () .iterdescendants () .iterchildren () og .itertext () metoder de strip_attributes () strip_elements () og strip_tags () funktioner samt iterparse () klasse.
  • C14N tillader angivelse af de inklusive præfikser at blive forfremmet til øverste niveau i løbet eksklusiv serialisering.
  • Bugs fast:
  • Passing lange Unicode-strenge i foderet () parser grænseflade undladt at læse hele strengen.

Hvad er nyt i version 2.3.5:

  • Crash når fusionerende tekst knuder i element.remove ( ).
  • Crash i sax / target parser ved indberetning tom doctype.

Hvad er nyt i version 2.3.4:

  • Crash når bygningen en nsmap (Element ejendom) med tom namespace URI'er.
  • Crash pga race condition, når fejl (eller brugernes meddelelser) forekomme under med gevind XSLT forarbejdning.
  • XSLT stylesheet kompilering kunne ignorere kompilering fejl.

Hvad er nyt i version 2.3.2:

  • funktioner tilføjet:
  • lxml.objectify.deannotate () har en ny boolean mulighed cleanup_namespaces at fjerne de objektivere namespace erklæringer (og generelt rydde op i namespace erklæringer) efter fjernelse af typen anmærkninger.
  • lxml.objectify fået sin egen delelement () funktion som en kopi af etree.SubElement at undgå en ellers overflødig import af lxml.etree på brugerens side.
  • Bugs fast:
  • Fast & quot; efterkommer & quot; fejl i cssselect en anden gang (efter en første fix i LXML 2.3.1). Den tidligere ændring resulterede i en alvorlig ydeevne regression for XPath baserede evaluering af den oversatte udtryk. Bemærk, at dette bryder brugen af ​​nogle af de genererede XPath udtryk som XSLT placering stier, der tidligere har arbejdet i 2.3.1.
  • Fast parsing af visse vælgere i cssselect. Mellemrum efter combinators & quot; & Gt; & quot ;, & quot; + & quot; og & quot; ~ & quot; er nu korrekt ignoreret. Tidligere er blevet analyseret som en efterkommer combinator. Eksempelvis & quot; div & gt; .foo & quot; blev parses det samme som & quot; div & gt; * .foo & quot; i stedet for & quot; div & gt; .foo & quot;.

Hvad er nyt i version 2.3.1:

  • funktioner tilføjet:
  • Ny mulighed kill_tags i lxml.html.clean at fjerne bestemte tags og deres indhold (dvs. deres hele undertræ).
  • pi.get () og pi.attrib om behandlingsinstruktioner at parse pseudo-attributter fra teksten indhold behandlingsinstruktioner.
  • lxml.get_include () returnerer en liste over omfatter stier, der kan anvendes til udarbejdelse ekstern C-kode mod lxml.etree. Dette specielt kræves for statisk forbundet LXML bygger når kode skal kompilere mod præcis de samme header filversioner som LXML sig selv.
  • Resolver.resolve_file () tager en ekstra mulighed close_file der konfigurerer hvis filen (-lignende) objekt vil blive lukket efter at have læst eller ej. Som standard, vil filen blive lukket, da brugeren ikke forventes at holde en henvisning til den.
  • Bugs fast:
  • HTML rengøring ikke fjerne 'data: ". Links
  • html5lib parser integration nu bruger den 'officielle' implementering i html5lib selv, hvilket gør det til at fungere med nyere versioner af biblioteket.
  • I lxml.sax kunne endElementNS () forkert afvise en almindelig mærkenavn, når den tilsvarende starten begivenhed udledt det samme almindeligt tag navn til at være i standard navnerummet.
  • Når en åben fil-lignende objekt ledes ind parse () eller iterparse (), vil parseren ikke længere tæt det efter brug. Dette vender en ændring i LXML 2.3, hvor alle filer ville blive lukket. Det er brugernes ansvar at korrekt lukke filen (-lignende) objekt, også fejlagtigt tilfælde.
  • Assertion fejl i lxml.html.cleaner når de skiller top-niveau elementer.
  • I lxml.cssselect bruge XPath »A // B« (forkortelse for »A / efterkommer-eller-selv :: node () / B ') i stedet for» A / efterkommer :: B «til css efterkommer selector ("A B"). Det gør et par kant tilfælde at være i overensstemmelse med vælgeren adfærd i WebKit og Firefox, og gør flere css udtryk gyldig placering stier (til brug i xsl: template match).
  • I lxml.html, ikke-udvalgte mærker ikke længere dukke op i de indsamlede danner værdier.
  • Tilføjelse / fjernelse værdier til / fra en udvalgt formularfelt multipel ordentligt vælger dem og blive fravalgt dem.
  • Andre ændringer:
  • Statisk bygger kan angive download mappe med --download-dir option.

Hvad er nyt i version 2.3:

  • funktioner tilføjet:
  • Når man ser for børn, lxml.objectify tager '{} tag' således en tom namespace, i modsætning til den forælder namespace.
  • Bugs fast:
  • Når du er færdig med at læse fra en fil-lignende genstand, parseren straks kalder sin .Luk () metode.
  • Når du er færdig parsing, iterparse () umiddelbart lukker inddatafilen.
  • Work-around for libxml2 bug, der kan forlade HTML parser i en ikke-funktionel tilstand efter parsing et alvorligt brudt dokument (fastsat i libxml2 2.7.8).
  • marque tag i HTML oprydning kode er korrekt navngivet lysavis.
  • Andre ændringer:
  • Nogle offentlige funktioner i Cython-niveau C-API har mere eksplicitte returtyper.

Hvad er nyt i version 2.2.8 / 2.3 Beta 1:

  • Crash i nyere libxml2 versioner når flytte elementer mellem dokumenter, der var attributter på udskiftede XInclude noder.
  • XMLID () funktion manglede de valgfrie parser og base_url- parametre.
  • Søgning efter wildcard tags i iterparse () blev brudt i Py3.
  • lxml.html.open_in_browser () virkede ikke i Python 3 på grund af brugen af ​​os.tempnam. Det tager nu en valgfri "encoding" parameter.

Krav :

  • Python

Lignende software

Andre software developer Martijn Faassen

z3c.relationfield
z3c.relationfield

14 Apr 15

hurry.resource
hurry.resource

11 May 15

Kommentarer til lxml

Kommentarer ikke fundet
Tilføj kommentar
Tænd billeder!