Sanitize

Software screenshot:
Sanitize
Software detaljer:
Version: 4.0.0 Opdateret
Upload dato: 12 May 15
Udvikler: Ryan Grove
Licens: Gratis
Popularitet: 38

Rating: nan/5 (Total Votes: 0)

Baseret på Nokogiri HTML parser for Ruby, rengøringssletning er en whitelist-baseret system til at fjerne HTML fra en blok af tekst.
Den "whitelist" teknik vil tillade udviklere til opsætning en liste over HTML-tags, som rengøringssletning vil bruge som reference for, hvad den mener "acceptabel" HTML.
Hver anden HTML-tag ikke er på listen, vil blive fjernet fra parset tekst.
Rengøringssletning kan arbejde med standardkompatible eller misdannet HTML.
Biblioteket kan registrere og filtrere HTML-tags, attributter og protokoller.
Den rensede tekst vil altid blive udsendt som gyldig HTML eller XHTML.
At hjælpe udviklere komme i gang med deres projekter, rengøringssletning kommer med et par færdige konfigurationer inkluderet. Kontroller README filen for flere detaljer

Hvad er nyt i denne udgivelse:.

  • Tilføjet to nye CSS config indstillinger: at_rules_with_properties og:. at_rules_with_styles
  • Tilføjet fulde støtte til CSS @ Page regler i afslappede config, herunder støtte til alle side-margin kasse regler.
  • Tilføjet følgende CSS at-regler til den afslappede config.
  • Tilføjet en hel bunke af CSS egenskaber til den afslappede config. Se den komplette liste her.
  • Lille ydeevne.
  • Opgraderet Crass til 1.0.2 for at afhente en rettelse, der påvirkede parsing af CSS @ Page regler.

Hvad er nyt i version 3.1.2:

  • Fast: #document og #fragment mislykkedes på frosne strygere, og kunne utilsigtet ændre ikke-fastlåste strenge, hvis de brugte en anden end UTF-8-kodning, eller hvis de indeholdt tegn ikke tilladt i HTML.

Hvad er nyt i version 3.0.2:

  • Opdateret Nokogumbo til 1.1.12, fordi 1.1. 11 lydløst vendt den forandring, vi forsøgte at samle op i den sidste udgivelse.

Hvad er nyt i version 3.0.0:

  • Tilføjet avancerede CSS desinficering support hjælp Crass, hvilket er i fuld overensstemmelse med CSS Syntaks Modul Niveau 3 parsing spec. Indholdet af positivliste & # X3C, stil & # x3e; elementer og stil attributter i HTML, vil blive desinficeret som CSS, eller du kan bruge rengøringssletning :: CSS-klasse til manuelt at rense CSS stylesheets eller egenskaber.
  • Tilføjet en: allow_doctype indstilling. Når sande, velformede DOCTYPE definitioner vil blive tilladt i dokumenter. Når falsk (standard), vil DOCTYPE definitioner fjernes fra dokumenter. DOCTYPE definitioner er aldrig tilladt i fragmenter, uanset denne indstilling.
  • Tilføjet følgende elementer til den afslappede config, foruden forskellige attributter:. Artikel, til side, krop, data, div, footer, hoved, header, html, vigtigste, nav, sektion, span, stil, titel
  • : whitespace_elements config er nu en Hash, og giver dig mulighed for at angive den tekst, der skal indsættes før og efter disse elementer, når de er fjernet. Den gammeldags Array-baseret config værdi stadig understøttes for bagudkompatibilitet.
  • Uegnede Unicode-tegn er nu fjernet fra HTML, før det er analyseret.
  • Fast:
  • Ikke-tag parentes i input som & quot; 1 & # x3e; 2 og 2 & # X3C; 1 & quot; nu analyseres og undslap korrekt i overensstemmelse med HTML5 spec, bliver & quot; 1 & gt; 2 og 2 & lt; 1 & quot;.
  • Søskende tilføjet efter den aktuelle node under traversal nu også gennemløbes. I tidligere versioner blev de simpelthen sprunget over.
  • Nokogiri er blevet smagt og besked på at stoppe med at tilføje nye linjer efter visse elementer, for hvis folk ønskede nye linjer der de ville have sat dem der, for fanden.

Hvad er nyt i version 2.0.6:

  • Version 2.0.5 uforvarende medtaget nogle work-in Progress ændringer, der ikke har gjort deres vej ind master gren.

Hvad er nyt i version 1.2.1:

  • Tilføjet en: remove_contents config indstilling. Hvis sat til sand, vil rengøringssletning fjerne indholdet af alle ikke-whitelisten elementer foruden selve elementerne. Hvis sat til en række element navne, vil rengøringssletning fjerne indholdet af kun de elementer (når filtreret), og lad indholdet af andre filtrerede elementer. [Tak til Rafael Souza til Array option]
  • Tilføjet en: output_encoding config indstilling for at tillade tegnkodning for HTML-output skal specificeres. Standarden er "utf-8".
  • Miljøet hash gået ind transformere omfatter nu en: nodenavn post indeholder den små bogstaver navnet på den aktuelle HTML node (f.eks & quot; div & quot;)
  • .
  • Returning andet end en Hash eller nul fra en transformator vil nu rejse en meningsfuld rengøringssletning :: Fejl undtagelsen end en utilsigtet NameError.

Krav :

  • Ruby 1.9.2 eller højere
  • Nokogiri 1.4.4 eller højere

Lignende software

django-html5
django-html5

6 Jun 15

DOMBrew
DOMBrew

13 May 15

FluentDOM
FluentDOM

22 Jul 15

Andre software developer Ryan Grove

Synchrotron
Synchrotron

13 Apr 15

Net::Amazon::S3
Net::Amazon::S3

11 May 15

JSHint
JSHint

10 Apr 16

Kommentarer til Sanitize

Kommentarer ikke fundet
Tilføj kommentar
Tænd billeder!
Søg efter kategori