Laden...

[erledigt] Adobe Reader parameterisierter Zugriff auf Suchfunktion

Erstellt von blackdns vor 10 Jahren Letzter Beitrag vor 10 Jahren 1.339 Views
B
blackdns Themenstarter:in
11 Beiträge seit 2013
vor 10 Jahren
[erledigt] Adobe Reader parameterisierter Zugriff auf Suchfunktion

Hallo zusammen,

mein Problem besteht darin, dass ich über den parameterisierten Aufruf der Suchfunktion des Adobe Readers nicht in der Lage bin, nach einem Wort zu suchen, das ein ß enthält.

Ein Beispiel wäre folgendes:

Wir nutzen das folgende PDF-Dokument

martinsmarkt.pdf

Wenn wir dieses Dokument im Root unseres C-Laufwerkes ablegen, und folgenden Befehl in die CMD füttern, sollte der Adobe Reader nach dem Wort außergewöhnlich suchen:

C:\Users\username>cd c:\

c:\>"c:\Program Files (x86)\Adobe\Reader 11.0\Reader\AcroRd32.exe" /A search=außergewöhnlich c:\martinsmarkt.pdf

Was aber passiert ist:

Die Suche wird durchgeführt und sucht nach "auergewhnlich" da die Umlaute verschluckt werden.

Das ä,ö,ü ist keine große Geschichte, da man es einfach durch a,o,u ersetzen kann und der Reader automatisch versteht, dass auch nach Umlauten gesucht werden soll.
Das ß hingegen kann ich nicht durch "ss" oder "s" ersetzen.

Hat irgendjemand Abhilfe zu diesem Problem? Das Adobe Forum kann mir offenbar nicht weiterhelfen.

Ich verstehe dies nicht als Encoding-Problem, falls ich falsch liege, bitte korrigiert mich.

Über all dem liegt bereits eine WPF-Anwendung, die ja aber nicht direkt mit dem Problem in Verbindung steht.

16.842 Beiträge seit 2008
vor 10 Jahren

Starte die CMD mal mit dem /U Parameter
Siehe dazu auch dessen Hilfe

B
blackdns Themenstarter:in
11 Beiträge seit 2013
vor 10 Jahren

hallo,

kannst du mir sagen wo die output-datei erstellt werden sollte? kann sie nicht finden.

die batch datei enthält jetzt lediglich ein

cmd /U

am anfang.

edit:

sorry offenbar die funktion falsch verstanden.

c:>"c:\Program Files (x86)\Adobe\Reader 11.0\Reader\AcroRd32.exe" /A search=au€ergew÷hnlich c:\martinsmarkt.pdf

das ist das ergebnis von "außergewöhnlich"

wie gehts von hier weiter? muss ich das encoding der cmd in irgendeiner weise anpassen?

falls ja bitte ein kleines point-towards - bin diesbezüglich noch sehr frisch hinter den ohren (web-dev)

16.842 Beiträge seit 2008
vor 10 Jahren

Ich hatte es so verstanden, dass Deine Umlaute gar nicht erst bei der Anwendung ankommen.. aber hab gerade getestet, dass dies - zumindest auf meinem ENU-System - nicht so ist und es theoretisch funktionieren sollte.

Also müsste es der Logik nach an der Adobe Exe liegen, die mit den Umlauten nichts anfangen kann und daraus vielleicht einfaches ASCII macht.
Wenn dies wirklich so sein sollte musst Du Dich vielleicht an den Adobe Support wenden.

B
blackdns Themenstarter:in
11 Beiträge seit 2013
vor 10 Jahren

dort habe ich schon 2 threads laufen (1 mal im englischen bereich - und nach dem es mir geraten wurde - noch einen im deutschsprachigen)

den support habe ich schon telefonisch kontaktiert, daraufhin wurde mir per mail ein link zu den adobe-foren gesendet mit der bitte mich dorthin zu wenden ... thanks

naja scheint wirklich ein aufwändigeres problem zu sein .... 😦

Hinweis von Abt vor 10 Jahren

Die entsprechenden Threads im Adobe Forum scheinen ä/ö/ü not used by adobe reader search function und Adobe Reader per Parameter nach Umlauten suchen lassen zu sein.

49.485 Beiträge seit 2005
vor 10 Jahren

Hallo blackdns,

so fein ist das nicht, (mindestens) drei Foren gleichzeitig zu beschäftigen, siehe [Hinweis] Wie poste ich richtig? Punkt 2.2. Das geht nur ausnahmsweise deshalb durch, weil es dafür anscheinend keine leicht zu findende Lösung gibt.

Ich würde sogar sagen, es gibt gar keine Lösung. Nach meinen Experimenten werden die Eingabedaten anscheinend unveränderlich als Codepage 437 interpretiert und gleichzeitig alle Zeichen mit Codes ab 128 - sofern möglich - auf das jeweils ähnlichste Zeichen mit einem Code unter 128 abgebildet. Aus den ganzen Strichgrafikzeichen werden z.B. + und - Zeichen.

In der Codepage 437 gibt es kein Eszett. Es gibt nur ein kleines griechisches Beta. Die griechischen Buchstaben werden in lateinische transkribiert; aus dem Alpha wird z.B. ein a, aus dem Gamma wird z.B. ein G. Das Beta wird allerdings komplett geschluckt, wie du es ja auch schon festgestellt hast. Aber selbst wenn man das irgendwie vermeiden könnte, würde daraus wohl ein b und kein Eszett werden.

Wenn es nun keine Wildcards oder Escapesequenzen gibt, dann geht es wohl einfach gar nicht.

herbivore

M
184 Beiträge seit 2012
vor 10 Jahren

Da bleibt dir wohl nichts anderes übrig, als die Suchmaske "zu fuß" zu füllen...

PDF-Datei mit Adobe Reader starten > Handle vom Reader merken
Suchefenster öffnen (Shift + Strg + F an das Fensterhandle senden)
Handle des Suchfensters suchen
Handle der Texteingabe suchen
Deinen Suchtext an die Texteingabe senden
Enter senden (oder den Button suchen und einen Mausklick senden)

im Prinzip nicht sonderlich kompliziert... Nur halt sehr unschön 😉

B
blackdns Themenstarter:in
11 Beiträge seit 2013
vor 10 Jahren

auf die idee war ich nicht gekommen, problem "gelöst" 😄

dankeschön 😉

W
113 Beiträge seit 2006
vor 10 Jahren

Hallo,

auch wenn du das Problem schon gelöst hast:
Eine schönere Lösung wäre mit einer .Net PDF Komponente wie z.B. PDFsharp den Text zu Suchen.

Schöne Grüße,
Xan

B
blackdns Themenstarter:in
11 Beiträge seit 2013
vor 10 Jahren

hallo warlord_xan,

das war mein erster versuch, die erkennungsquote war allerdings weit unter 50% von der die der reader leisten konnte, daher fiel das leider raus.