Laden...

PDF Tabelle auslesen

Erstellt von Sonne123 vor 11 Jahren Letzter Beitrag vor 11 Jahren 2.030 Views
S
Sonne123 Themenstarter:in
72 Beiträge seit 2010
vor 11 Jahren
PDF Tabelle auslesen

Hallo,

ich habe eine pdf-Datei, die eine Tabelle enthält. Ich möchte jetzt gerne die pdf über C# auslesen und am besten in einem Datatable oder Array speichern.

Habe es schon über einen StreamReader oder einem PDFReader probiert aber da habe ich die Daten vom pdf nur in einem string gespeichert.

Ich hoffe mir kann einer einen Ansatz geben.

Grüße

1.820 Beiträge seit 2005
vor 11 Jahren

Hallo!

Auf CodeProject und CodePlex gibt es mehrere PDF-Reader. Da musst dann allerdings immer noch prüfen, in welchem Objekt-Typ die Tabelle verwaltet wird, dass sollte aber im Debugger rel. einfach nachvollziehbar sein.

Nobody is perfect. I'm sad, i'm not nobody 🙁

S
Sonne123 Themenstarter:in
72 Beiträge seit 2010
vor 11 Jahren

Habe jetzt folgendes:


 PdfDocument pdf = new PdfDocument(dateiname);

           
string documentTextFile = "Document text.txt";

 using (StreamWriter writer = new StreamWriter(documentTextFile))
          writer.Write(pdf.GetText());

    Process.Start(documentTextFile);
           
 

Habe jetzt zwar alle Daten in einer Textdatei. Jedoch habe ich immernoch nicht rausgefunden wie ich die Tabelle auslesen kann. Also celle für celle. Mir würde es ja schon reichen, wenn ich das ende der spalte erreiche (z.b. erreichen des zeichens "|").
Ich bin so hilflos und wäre sehr dankbar wenn mir einer weiter helfen kann.