Laden...

Handschriftlich ausgefüllte Vorlage + OCR

Erstellt von Campy vor 11 Jahren Letzter Beitrag vor 11 Jahren 3.528 Views
C
Campy Themenstarter:in
439 Beiträge seit 2008
vor 11 Jahren
Handschriftlich ausgefüllte Vorlage + OCR

Hallo zusammen,

ein Kunde von uns gibt an seine Mitarbeiter ausgedruckte Vorlagen aus, die dann handschriftlich ausgefüllt werden (Zahlen + Ankreuzen und evtl. Text).

Diese Dokumente werden dann ausgefüllt in der Zentrale abgegeben und per Hand ins Programm übernommen.

Meine Frage an Euch ist nun, ob OCR schon soweit ist dies zuverlässig auswerten zu können (Kontrolliert kann das ganze ja dann manuell noch werden) und welche Library zu empfehlen wäre.

Vielen Dank!
Campy

A programmer is just a tool, which converts coffeine into code! 🙂

H
21 Beiträge seit 2012
vor 11 Jahren

Hallo,

welche Softwareseitige Lösung man da einsetzen könnte würde mich auch interessieren (dll ?????!)

Wir setzen OCR in unserer Firma auch ein und werten die Aufträge mit einer Software von B&L aus. Ich kann dazu nur sagen, dass es je nach Land auch unterschiedliche Schreibweisen gibt (so auch bei jedem Menschen) und somit die Qualität des gelesenen schwankt. Die Engländer schreiben zum Beispiel eine 7 die aussieht wie eine 1. Da ist die Frage wie sauber die Mitarbeiter schreiben. WEnn einer eine absolute Sauklaue hat wirds eng 😃

Käme auf einen Versuch an. Bei uns hat es sich etabliert "Kästchen" im Hintergrund vorzudrucken, wo in Druckbuchstaben das ganze eingetragen wird. Das erleichtert OCR die Arbeit enorm. Schreibschrift könnte da schon ein Problem werden.

Am Ende hat man aber noch eine Prüfung wo man sich die Blätter nochmal angucken kann ob alles gelesen wurde. Wenn man es richtig macht geht es auf jedenfall schneller als selbst tippen - selbst mit Korrekturen.

Gruß

C
Campy Themenstarter:in
439 Beiträge seit 2008
vor 11 Jahren

Hallo Hellfire76,

das mit den Kästchen und Druckbuchstaben ist ein super Tipp und auf jeden Fall auch für den Kunden machbar.

Die manuelle Korrektur der Eingaben ist so auch geplant aber ich denke, dass die Zeitersparnis enorm ist.

Viele Dank!
Campy

A programmer is just a tool, which converts coffeine into code! 🙂

T
708 Beiträge seit 2008
vor 11 Jahren

Hallo zusammen,

wirf doch mal einen Blick auf den EasyPen.
Dort kauft man Papier, welches im Hintergrund mit einem nahezu unsichtbaren Raster versehen ist. Darauf wird das Formular gedruckt.
Der Stift, mit dem geschrieben wird, ist mit einer Kamera versehen, der die exakte Position auf dem Formular und das Formular selbst kennt.
Macht man an einer Stelle einen Haken, so ist das Formular abgeschlossen und wird per Bluetooth an das Handy und dann einen Server übermittelt, der die Übersetzung vornimmt. Die Qualität liegt wohl jenseits der 90%.

Es handelt sich dabei dann natürlich um ein Bezahlmodell...

C
Campy Themenstarter:in
439 Beiträge seit 2008
vor 11 Jahren

Hallo trib,

die Idee ist nicht schlecht nur haben die Mitarbeiter des Kunden nicht immer ein Handy dabei (Baubranche).

Die Mitarbeiter sollen nach wie vor die Zettel abgeben und diese will ich dann auswerten. Wäre es Möglich Tablets oder ähnliches an die Mitarbeiter / Baustellen zu verteilen hätte ich das Problem natürlich nicht 😉.

Noch keiner mit einer kostenlosen OCR Software gearbeitet?

Viele Grüße
Campy

A programmer is just a tool, which converts coffeine into code! 🙂

B
357 Beiträge seit 2010
vor 11 Jahren

Für ein Projekt in der Firma habe ich mich massiv mit OCR beschäftigen müssen und dabei bin ich ca. 30 OCR-Engines durchgegangen. Vorab: Die kostenlosen waren allesamt absolut unzureichend und nicht mal im Ansatz zu gebrauchen. Alle hätten noch hunderte oder tausende Stunden Arbeit benötigt, die ich nicht investieren konnte. Daher ging es zu den kostenpflichtigen. Besonders gut waren die von Accusoft oder auch Abby. Allerdings waren die SDKs und Lizenzkosten nahezu unbezahlbar (5000 € fürs SDK + 350 pro Arbeitsplatz bei Accusoft). Letztlich bin ich dann bei TOCR gelandet, die recht günstig ist und dafür auch noch sehr gute Ergebnisse liefert. Ist halt ein bisschen Arbeit, bis man sich da eingearbeitet hat, aber da wars insgsamt der beste Kompromiss aus Kosten und zu investierender Arbeit.

C
Campy Themenstarter:in
439 Beiträge seit 2008
vor 11 Jahren

Hallo bredator,

vielen Dank! Ich werde mir das mal genauer anschauen.
Kostentechnisch ist der Preis von TOCR kein Problem.

Viele Grüße
Campy

A programmer is just a tool, which converts coffeine into code! 🙂

C
Campy Themenstarter:in
439 Beiträge seit 2008
vor 11 Jahren

Hallo zusammen,

mit handschriftlich ausgefüllten Formularen kommt aber auch TOCR nicht wirklich gut zurecht (Getestet mit dem Viewer der Demo).

Gibt es nicht noch andere OCR C# Libraries? Sie dürfen auch etwas mehr kosten solange ich es vorher über eine Trial probieren kann.

Vielen Dank!

A programmer is just a tool, which converts coffeine into code! 🙂

49.485 Beiträge seit 2005
vor 11 Jahren

Hallo Campy,

ich will natürlich nicht vereiteln, dass vielleicht doch noch jemand eine Bibliothek kennt, bei der sowohl deren Preis also auch deren Qualität zwischen TOCR auf der einen Seite und Accusoft oder Abby auf der anderen Seite liegen. Besonders groß schätze ich die Chance nach dem was bredator gesagt hat aber nicht ein. Du wirst dich entscheiden müssen: günstige, aber schlechtere Erkennung oder teure, aber bessere Erkennung. Qualität hat ihren Preis.

Wobei die Erkennungsraten bei Handschriften, grundsätzlich niedriger liegen als bei gedruckten Texten (die mittlerweile fast fehlerfrei erkannt werden). Je nach Schreiber möglicherweise sehr deutlich geringer.

Außerdem ist die Erkennung bei Daten, wo es jedes Zeichen für sich richtig erkannt werden muss, grundsätzlich niedriger, als bei Worten in einem Fließtext, bei denen aus dem Kontext auf das richtige Wort geschlossen werden kann, wo es für eine richtige Erkennung des Wortes also möglicherweise reicht, 80% der Einzelbuchstaben richtig zu erkennen.

Die Erkennungsrate lässt sich u.U. durch Vorgaben, wie die einzelnen Zeichen geschrieben werden müssen, steigern. Teilweise sehen die Formen der Buchstaben dann recht anders aus, als man sie normalerweise kennt. Davon müssen aber alle Mitarbeiter wissen, das üben und sich auch stets daran halten.

Deshalb werden manchmal immer noch Formulare verwendet, in denen nicht beliebige Zeichen eingetragen werden können, sondern wo für jede Stelle jeweils alle Zeichen aufgedruckt sind, und nur noch markiert (z.B. eingekreist) werden müssen.

herbivore

C
Campy Themenstarter:in
439 Beiträge seit 2008
vor 11 Jahren

Hallo herbivore,

vielen Dank für deine ausführliche Antwort.

Wir sind nun zu dem Entschluss gekommen, auch vorgedruckte Formulare zu verwenden auf dem dann nur noch die Optionen angekreuzt werden müssen.

Dennoch wäre ich dankbar für gute Produkte die sich bei einen von Euch bewährt haben. Den preislichen Aspekt kann man erstmal außen vor lassen aber ich denke für <2000 - 3000€ wird sich schon was finden?

Gruß
Campy

A programmer is just a tool, which converts coffeine into code! 🙂

6.911 Beiträge seit 2009
vor 11 Jahren

Hallo Campy,

eine (.net-) Komponente kenne ich keine, aber einen Weg wie ein solche zu finden ist.
Betreibe ein wenig Literaturrecherche nach Handschrifterkennung bei der Post (v.a. im Englisches bzw. US-Raum gibts dazu viele Papers) und nach den dort vorgestellten Algorithmen/Verfahren kannst du dann (via Google, etc.) versuchen eine Komponente zu finden.

mfG Gü

Stellt fachliche Fragen bitte im Forum, damit von den Antworten alle profitieren. Daher beantworte ich solche Fragen nicht per PM.

"Alle sagten, das geht nicht! Dann kam einer, der wusste das nicht - und hat's gemacht!"

C
Campy Themenstarter:in
439 Beiträge seit 2008
vor 11 Jahren

Hallo bredator,

ich habe mir TOCR nun mal im Zusammenhang ohne handschriftlicher Dokumente angeschaut und bin mit dem Ergebnis sehr zufrieden.

Hast du auch mit ankreuzbaren Feldern oder ähnlichem gearbeitet?
Leider habe ich noch nicht herausgefunden wie das funktioniert und ob es funktioniert.

Vielen Dank!

A programmer is just a tool, which converts coffeine into code! 🙂