Hallo,
ich möchte gern über c# den Inhalt einer dynamsiche Webseite auslesen.
Wie ich den HTML-Code einer Seite bekomme, ist mir bekannt.
Es geht aber darum, das zu parsen, was mir zB. der InternetExplorer endgültig anzeigt.
Gibt es irgendeine Möglichkeit auf den Parser oder was auch immer des Internet Explorer zuzugreifen?
Hallo,
Wie ich den HTML-Code einer Seite bekomme, ist mir bekannt.
Es geht aber darum, das zu parsen, was mir zB. der InternetExplorer endgültig anzeigt.
Und was soll der Unterschied sein? Der IE zeigt doch genau das erhaltene Dokument an.
Gruß, MarsStein
Non quia difficilia sunt, non audemus, sed quia non audemus, difficilia sunt! - Seneca
Richtig, der InternetExplorer zeigt mir das erhaltene Dokument an!
Und genau das brauche ich auch, aber von C# aus, damit ich den Inhalt (nicht den HTML-Source-Code!) weiterverarbeiten kann!
Es geht aber darum, das zu parsen, was mir zB. der InternetExplorer endgültig anzeigt. Nehme mal an Du meinst das was man sieht wenn man rechte Maustaste -> View Source macht oder?
Grüsse
Daniel
Space Profile
Wer nicht fragt, der nicht gewinnt
Hallo,
Du musst das Dokument entweder mit dem Webbrowser-Control laden, und dann über Document/DomDocument zugreifen oder es mittels SGMLReader oder einem HTMLParser (such mal bei Codeproject) selbst parsen.
Gruß, MarsStein
Non quia difficilia sunt, non audemus, sed quia non audemus, difficilia sunt! - Seneca
Hallo,
...Webbrowser-Control laden, und dann über Document/DomDocument ...
Gruß, MarsStein
Gibt es dazu vielleicht kurze Code-Beispiele? Wäre super!
Hallo,
schau doch mal in der Doku
Da kannst Du dich dann über die genannten Begriffe vom WebBrowser bis zum Dokument durchhangeln.
Bei konkreten Problemen frag nochmal nach, aber bitte beachte auch [Hinweis] Wie poste ich richtig? , v.a. Punkte 1.1 und 4b
Gruß, MarsStein
Non quia difficilia sunt, non audemus, sed quia non audemus, difficilia sunt! - Seneca