Laden...

Suchmaschiene indexbasiert

Erstellt von Marco14612 vor 16 Jahren Letzter Beitrag vor 16 Jahren 1.359 Views
M
Marco14612 Themenstarter:in
3 Beiträge seit 2006
vor 16 Jahren
Suchmaschiene indexbasiert

Hallo
Ich möchte gern eine Anwendung entwickeln die eine Strucktur (meist Worddokumente) untergliedert in Ordnern durchläuft und diese Dokumente
parst. Gefundene Schlüsselwörte in eine Datenbank schreib. Für eine spätere schnellere suche.

Nun meine Frage :
Welche sind die Schlüsselwörter, ich habe keine Ahnung welche Wörter später als index notwendig sind. Hat jemand einen Plan wie ich an die sache rangehen sollte ?

Danke im Vorfeld 🙂

49.485 Beiträge seit 2005
vor 16 Jahren

Hallo Marco14612,

Welche sind die Schlüsselwörter, ich habe keine Ahnung welche Wörter später als index notwendig sind.

wir auch nicht. 🙂 Du musst schon selber festlegen, was die relevanten Informationen sind.

Ein bisschen klingt das ja nach Volltextsuche. Dann würdest du einfach alle Worte nehmen, mal abgesehen vielleicht von ein paar Stoppworten (Siehe wie im Forum richtig suchen).

herbivore

M
402 Beiträge seit 2005
vor 16 Jahren

Hi!

Schau Dir doch mal die Volltextsuche
"Lucene.net" an. Damit läßt sich so eine
Volltextindizierung realisieren.

Der Vorteil ist der Einsatz von IFilter.
damit können alle Dateiformate für die es einen
IFilter gibt indiziert werden. Diese werden
auch von MS Desktop-Search und dem IndexDienst
verwendet.

http://incubator.apache.org/lucene.net/