Laden...

Inhalt einer im Browser dargestellten Seite auslesen

Erstellt von r1c0 vor 11 Jahren Letzter Beitrag vor 11 Jahren 3.123 Views
R
r1c0 Themenstarter:in
5 Beiträge seit 2011
vor 11 Jahren
Inhalt einer im Browser dargestellten Seite auslesen

Hallo zusammen,

ich möchte per code im std Browser eine Web-Seite öffnen und dann den Quelltext dieser Seite auslesen, welcher nun im Programm weiterverarbeiten. Direkt die Webseite auslesen klappt nicht, weil ich mich erst darauf anmelden muss.

Jemand eine Idee?

Danke!

76 Beiträge seit 2008
vor 11 Jahren

Ich verstehe kein Wort...
Du möchtest eine Webseite auslesen, die erst Zutretbar ist, wenn man sich dort vorher angemeldet hat?

Hier eine Idee, die möglicherweise illegal ist. Das musst du auf der Webseite nachlesen, ob das Anmelden und verwenden der Seite via Crawlern, Bots, etc. erlaubt ist. Wenn du Glück hast, gibt es eine API.

Du sendest einen HTTP-POST-Request an die Anmeldeseite (möglicherweise login.php). Als POST-Parameter sendet du alle erforderlichen Anmeldedaten.
Anschließend erhälst du von der Seite Cookies, darunter auch die PHPSESSID.
Anhand der in diesem Cookie abgespeicherten Sitzungs-Nummer wird ein angemeldeter Benutzer erkannt.
Anschließend kannst du einen HTTP-Request mit der PHPSESSID senden und solltest statt eine "Zugriff verweigert"-Seite die gewünschte Seite sehen.

Ansonsten gilt: [Hinweis] Wie poste ich richtig?

R
r1c0 Themenstarter:in
5 Beiträge seit 2011
vor 11 Jahren

Danke das du trotzdem geantwortet und auch die Frage ganz gut getroffen hast. Den POST Request werde ich auch mal ausprobieren.

Vllt ist meine eigentliche frage wie folgt einfacher formuliert:

Im Browser wird aktuell eine Webseite angezeigt. Wenn ich mir per rechtsklick den Quellcode anzeigen lasse, finde ich auch was ich suche. Kann ich meinem Programm sagen, dass es den Quelltext aus dem aktuell im Browser geöffneten Fenster ausliest?

2.760 Beiträge seit 2006
vor 11 Jahren

Das dürfte nicht so einfach gehen außer du baust ein Browserplugin. Wie wichtig ist es denn das es aus dem aktuell geöffneten Standarbrowser ausgelesen werden muss? Ansonsten gibt es dazu schon recht viel Zeug im Forum. Siehe z.B.: WebClient mit HTTP-POST- und Cookie-Unterstützung

R
60 Beiträge seit 2006
vor 11 Jahren

Wenn du den standart Browser anzapfen musst, dann schau mal AutoIt an.
Damit kannst du das machen. Es gibt auch ein C# plugin.

Gruss Roger

5.658 Beiträge seit 2006
vor 11 Jahren

ich möchte per code im std Browser eine Web-Seite öffnen und dann den Quelltext dieser Seite auslesen, welcher nun im Programm weiterverarbeiten.

Muß es wirklich der Standardbrowser sein (d.h. ein externes Programm)? Du könntest auch das Webbrowser-Control verwenden, dann hast du die volle Kontrolle, und kannst den Quelltext einfach über ein Property auslesen.

Christian

Weeks of programming can save you hours of planning