Laden...

Wortart ermitteln, vielleicht via Word?

Erstellt von scub vor 12 Jahren Letzter Beitrag vor 12 Jahren 2.380 Views
S
scub Themenstarter:in
20 Beiträge seit 2011
vor 12 Jahren
Wortart ermitteln, vielleicht via Word?

Hallo,

ich stehe vor der Aufgabe eine Liste mit Wörtern durchgehen zu wollen und zu überprüfen um welchen Typ (Nomen, Verb, Adjektiv) es sich dabei handelt.

Meine erste Idee war das ganze eventuell über eine Synonym DB via API laufen lassen zu können oder die Ausgabe von http://de.wiktionary.org zu parsen.

Dies würde allerdings ne Menge Traffic erzeugen und wäre sicher auch nicht die schnellste Lösung.

Daher war meine Idee ob man die Word Funktionen nutzen kann um an diese Daten zu kommen. Ich habe auch einige Beispiele zum Thema Rechtschreibprüfung via Word API gefunden allerdings nichts darüber wie man die Grammatik Infos auslesen kann?

Wäre für jede Hilfe dankbar.

gruß
Scub

6.911 Beiträge seit 2009
vor 12 Jahren

Hallo scub,

über eine Synonym DB via API laufen lassen zu können oder die Ausgabe von
>
zu parsen.

diese beiden Möglichkeiten könntest du ja kombinieren. Ist ein Wort nicht in der DB vorhanden schlägst du das nach und lässt so die DB dazulernen.

Bei der Word-Variante musst du daran denken, dass Word auf dem Zielrechner auch installiert sein muss um dessen Funktionen verwenden zu können.

mfG Gü

Stellt fachliche Fragen bitte im Forum, damit von den Antworten alle profitieren. Daher beantworte ich solche Fragen nicht per PM.

"Alle sagten, das geht nicht! Dann kam einer, der wusste das nicht - und hat's gemacht!"

E
180 Beiträge seit 2010
vor 12 Jahren

präziser als das Wiki ist sogar noch Canoonet, lässt sich wunderbar nutzen, und ist sogar in der Lage unbekannte und zusammengesetze Wörter zu analysieren. Die Nutzung ist gemäß den AGB für Automatisierung auch genehmigt, bzw. steht nix gegenteiliges drin. Ansonsten würd ich dir auch den Ansatz empfehlen, was nachgeschlagen wurde speichern, ansonsten laden, prüfen, speichern. Eine andere Möglichkeit ohne dafür Geld auszugeben kenn ich leider auch nicht.

Gruß

49.485 Beiträge seit 2005
vor 12 Jahren

Hallo scub,

du solltest aber unbedingt darauf achten, dass das Zwischenspeichern ein reines Caching ist, um unnötige Abfragen zu vermeiden. Wenn du die Abrufe dagegen mit dem Ziel durchführst, die Original-Datenbank möglichst vollständig zu kopieren, kannst du Probleme bekommen, denn solche Datenbanken sind als Datenbankwerk urheberrechtlich geschützt - und zwar auch dann, wenn jedes einzelne Datum für sich genommen Allgemeingut ist. Außerdem musst du prüfen, ob die AGBs des Anbieters einen automatischen Abruf zulassen. Wenn nicht, solltest du die Finger von der Webseite des Anbieter lassen.

herbivore

G
47 Beiträge seit 2011
vor 12 Jahren

Hi,

zu Canoonet hab ich folgendes in den AGBs gefunden:

Urheberrecht

Sämtliche Rechte an der im Rahmen dieses Online-Angebots entwickelten Software, den zugrunde liegenden Datenbanken und sonstigen Inhalten liegen bei der Canoo Engineering AG, soweit nicht ausdrücklich ein anderer Urheber oder Rechtsinhaber genannt wird. Die Rechte der Inhalte des Bedeutungswörterbuchs liegen bei der Universität Tübingen. Jede Verwendung der Software, der Daten oder der sonstigen Inhalte außer in der Form, wie sie unter
>
angeboten und ermöglicht wird, ist nicht erlaubt. Es ist insbesondere nicht gestattet, jedwede Art von Inhalten per Script oder auf andere Weise automatisiert abzufragen.

Eine Scriptabfrage ist also ausdrücklich nicht erlaubt.

Gruß Gwinn

49.485 Beiträge seit 2005
vor 12 Jahren

Hallo Gwinn,

allerdings steht nicht da, dass die Abfrage im Browser erfolgen muss. Und selbst wenn, wäre das mangels genauer Definition, was ein Browser ist, witzlos. Wenn man also in das Programm einbauen würde, dass der Benutzer auf jedes Wort der Liste einzeln klicken muss, um die Abfrage auszulösen, wäre das sicher kein Script und kein Automatismus, sondern nichts anderes, als wenn der Benutzer in einem normalen Webbrowser hintereinander mehrere Links auf www.canoo.net anklickt.

Wobei das nur meine persönliche Meinung ist und keine juristische Auskunft. Und ob es was nützt, steht auch in den Sternen. Bei ab und zu mal einer Liste mit vielleicht zehn Worten mag das noch machbar sein. Bei Listen von hunderten Worten wäre das nicht nur für den Benutzer inakzeptabel, sondern dann könnte man auch schon davon sprechen, dass hier nur das Scripting-Verbot umgangen werden soll.

herbivore