in meinem Programm muss ich PDF-Dateien auslesen. Bisher ging das mit iTextSharp auch ganz gut, aber seit die PDFs in der Version 1.7 (davor 1.4) vorliegen, funktioniert das nicht mehr. Also habe ich iText7 in der Version 7.23 installiert, da dabei nur wenig Code zu ändern ist. Beim Testlauf stellte ich dann fest, dass die Unterscheidung für Groß- oder Kleinbuchstaben für das Programm wohl nicht relevant ist.
Rufe ich die Datei über z.B. SumatraPDF auf, steht alles in Großbuchstaben da, iText7 gibt mir aber zurück:
"FüR DIE BunDESREPuBlIK DEuTScHlanD". Was soll das? Hat jemand 'ne Erklärung, gibt's eine Lösung dazu?
Die korrekte Groß/Kleinschreibung brauche ich unbedingt!
string inhalt;
using (PdfReader pdf = new PdfReader(daten)) // daten: MemoryStream
using (PdfDocument doc = new PdfDocument(pdf))
{
SimpleTextExtractionStrategy strategie = new SimpleTextExtractionStrategy();
inhalt = PdfTextExtractor.GetTextFromPage(doc.GetPage(i), strategie).Trim();
}