Hallo liebe Leute,
ich befasse mich zur Zeit mit Statistik und Analyse von Texten(Emails, WebCrawling) bzw ich versuche mir da Wissen anzueignen.
Hab mich jetzt viel mit regex beschäftigt ist auch soweit alles verstanden. Wollte euch jetzt mal fragen ob ihr da gute Bücher/Tutorials/Videos zu dem Thema kennt da es doch sehr komplex ist.
Danke schon mal im Vorraus
Viele Grüße
Tiega
Hallo Tiega,
Statistik ist ein weites Feld. Kannst du bitte eingrenzen, welche Themen dich interessieren.
herbivore
mmh ja hab auch lange überlegt wie ich das beschreibe.
Aber ich mach am besten mal ein beispiel:
Wir Handeln mit Gebrauchten Schiffsmotoren. Da der Markt an sich ja nicht so leicht durch eigene Verkäufe zu analysieren, weil die Absatzzahlen einzelner Motoren zu klein sind, ist wollen wir alle Emails auf Angebote und Anfragen durchsuchen um dadurch einen Analyse anzustellen wie viele Motoren so auf dem Markt sind und wichtiger einen Durchschnittspreis errechnen.
Da jetzt natürlich die Angebote und Anfragen nicht immer einem Standard Format folgen muss ich nach mit Stichwörtern(Motorhersteller, Baureihe, Laufzeit, Währung) die Motoren Identifizieren und Doppelte anhand der Laufzeit erkennen.
Kann man mit dem Beispiel was anfangen?
Ich hoffe 😃
Viele Grüße
Tiega
Hallo Tiega,
ich würde an deiner Stelle nicht nach Statistik, sondern nach Computerlinguistik und da insbesondere nach semantischer Analyse suchen.
herbivore
Deutlich leichterer Einstieg: Manning: Taming Text.
Sehr gut für Programmierer die nicht forschen sondern vor allem etwas umsetzen wollen.
As a man thinketh in his heart, so he is.