Hallo zusammen,
ich möchte per code im std Browser eine Web-Seite öffnen und dann den Quelltext dieser Seite auslesen, welcher nun im Programm weiterverarbeiten. Direkt die Webseite auslesen klappt nicht, weil ich mich erst darauf anmelden muss.
Jemand eine Idee?
Danke!
Ich verstehe kein Wort...
Du möchtest eine Webseite auslesen, die erst Zutretbar ist, wenn man sich dort vorher angemeldet hat?
Hier eine Idee, die möglicherweise illegal ist. Das musst du auf der Webseite nachlesen, ob das Anmelden und verwenden der Seite via Crawlern, Bots, etc. erlaubt ist. Wenn du Glück hast, gibt es eine API.
Du sendest einen HTTP-POST-Request an die Anmeldeseite (möglicherweise login.php). Als POST-Parameter sendet du alle erforderlichen Anmeldedaten.
Anschließend erhälst du von der Seite Cookies, darunter auch die PHPSESSID.
Anhand der in diesem Cookie abgespeicherten Sitzungs-Nummer wird ein angemeldeter Benutzer erkannt.
Anschließend kannst du einen HTTP-Request mit der PHPSESSID senden und solltest statt eine "Zugriff verweigert"-Seite die gewünschte Seite sehen.
Ansonsten gilt: [Hinweis] Wie poste ich richtig?
Danke das du trotzdem geantwortet und auch die Frage ganz gut getroffen hast. Den POST Request werde ich auch mal ausprobieren.
Vllt ist meine eigentliche frage wie folgt einfacher formuliert:
Im Browser wird aktuell eine Webseite angezeigt. Wenn ich mir per rechtsklick den Quellcode anzeigen lasse, finde ich auch was ich suche. Kann ich meinem Programm sagen, dass es den Quelltext aus dem aktuell im Browser geöffneten Fenster ausliest?
Das dürfte nicht so einfach gehen außer du baust ein Browserplugin. Wie wichtig ist es denn das es aus dem aktuell geöffneten Standarbrowser ausgelesen werden muss? Ansonsten gibt es dazu schon recht viel Zeug im Forum. Siehe z.B.: WebClient mit HTTP-POST- und Cookie-Unterstützung
Wenn du den standart Browser anzapfen musst, dann schau mal AutoIt an.
Damit kannst du das machen. Es gibt auch ein C# plugin.
Gruss Roger
ich möchte per code im std Browser eine Web-Seite öffnen und dann den Quelltext dieser Seite auslesen, welcher nun im Programm weiterverarbeiten.
Muß es wirklich der Standardbrowser sein (d.h. ein externes Programm)? Du könntest auch das Webbrowser-Control verwenden, dann hast du die volle Kontrolle, und kannst den Quelltext einfach über ein Property auslesen.
Christian
Weeks of programming can save you hours of planning