PDFMiner

Skjermbilde programvare:
PDFMiner
Prog.varedetaljer:
Versjon: 20140328
Last opp dato: 13 May 15
Utvikler: Yusuke Shinyama
Lisens: Gratis
Popularitet: 245

Rating: 1.5/5 (Total Votes: 2)

PDFMiner fungerer ved først å ta innholdet i en PDF-fil og konvertere den til en mer form format som HTML.
Derfra er tekst og data hentet og analysert, og basert på forhåndsdefinerte regler separerte og presenteres for brukeren eller sendes til andre mer kraftige data analyseverktøy.
Hvis tekstanalyse er ikke hva du har tenkt å gjøre, kan du enkelt konfigurere PDFMiner å bare trekke ut eller bare konvertere PDF-data også.
Funksjonene kan jobbe separat fra hverandre og tillate en bredere bruk spektrum takket være det

Egenskaper .

  • 100% Python kode, ingen C eller C ++
  • analysere PDF-filer
  • Analyser PDF-filer
  • Konverter PDF-filer til andre formater
  • ToC vifte
  • Få bare merket innhold
  • Støtte for et stort antall tekst PDF funksjoner
  • Støtte for et stort antall skrifttyper inne PDF-filer
  • support Basic kryptering (RC4)

Hva er nytt i denne versjonen:

  • PDFDocument.initialize () metoden er fjernet og ikke lenger nødvendig . Et passord er gitt som et argument for en PDFDocument konstruktør.

Hva er nytt i versjon 20110515:.

  • API endringer
  • LTPolygon klassen ble omdøpt LTCurve.

Hva er nytt i versjon 20110227:.

  • Feilrettinger og forbedringer layout analyse

Hva er nytt i versjon 20101226:.

  • Et par feilrettinger og mindre forbedringer

Hva er nytt i versjon 20101017:.

  • Et par feilrettinger og mindre forbedringer

Hva er nytt i versjon 20100424:.

  • Bugfikses og små forbedringer på TOC utvinning

Krav

  • Python 2.4 opp til 3

Begrensninger .

  • PDFMiner kan være 20 ganger tregere enn C / C ++ - basert programvare

Lignende programvare

OBITools
OBITools

12 Apr 15

Grappelli
Grappelli

18 Apr 16

PyICU
PyICU

13 May 15

httpagentparser
httpagentparser

13 Apr 15

Annen programvare fra utvikleren Yusuke Shinyama

XCruiser
XCruiser

3 Jun 15

Kommentarer til PDFMiner

Kommentarer ikke funnet
Legg til kommentar
Slå på bilder!