Software detaljer:
pdfminer3k er en havn i pdfminer skrevet i Python 3.
PDFMiner er et værktøj til at udtrække oplysninger fra PDF-dokumenter. I modsætning til andre PDF-relaterede værktøjer, fokuserer udelukkende på at få og analysere tekstdata.
PDFMiner gør det muligt at opnå den nøjagtige placering af tekster i en side, samt andre oplysninger, såsom fonte eller linjer. Det omfatter en PDF konverter, der kan omdanne PDF-filer til andre tekstformater (f.eks HTML). Det har en Extensible PDF parser, som kan anvendes til andre formål i stedet for tekstanalyse
Hvad er nyt i denne udgivelse:.
- < li> Tilføjet pdfexplore, et værktøj til at fejlsøge PDF'er ved at udforske deres data.
- Forsøg ikke at gruppere tekstbokse, når der er for mange (det tager for lang tid).
- Support objekt referencer som filtre i vandløb.
- Parse hver genstand, så snart der ikke kan findes en objekt-.
- Forbedret de strenge baserede fejlhåndtering formsprog.
Hvad er nyt i version 1.2.4:
- Når xref tabeller er korrupte, analysere og cache alle objekter som en fallback.
- Rettet en falsk påstand i layout.
Hvad er nyt i version 1.2.3:.
- Fast et nedbrud på ujævne Cmap koder
- Fast en meta-nedbrud forårsaget af dårlig PSParser Repr.
Krav :
- Python
Kommentarer ikke fundet