FB18.de - Das Informatikforum
dynamisch generierte Webseiten nach text/bild durchsuchen - Druckversion

+- FB18.de - Das Informatikforum ( /mybb )
+-- Forum: Off-Topic ( /forumdisplay.php?fid=115 )
+--- Forum: Hard- und Softwarefragen ( /forumdisplay.php?fid=48 )
+--- Thema: dynamisch generierte Webseiten nach text/bild durchsuchen ( /showthread.php?tid=12049 )


dynamisch generierte Webseiten nach text/bild durchsuchen - Marek Schuller - 02.04.2011 11:59

Hallo, ich heisse Marek und bin zur Zeit in der 13. Klasse.
Ein Freund hat mir gesagt, dass ihr mir vielleicht weiterhelfen könnt.

Es geht darum, dass ich heine Webseite habe, die ca. 5000 Seiten mit dynamischem Inhalt und Subseiten generiert (aus einer datenbank). Innerhalb dieser Webseiten soll nun nach einem suchtext oder einem spezifischen Bildlink gesucht werden. Leider ist das, wenn ich das per Hand mache sehr sehr mühsam.

Gibt es da vielleicht eine elegante Möglichkeit, die Seiten automatisch durchsuchen zu lassen und dann z.B. die Seiten ausgeben zu lassen, in welchen der gewünschte Suchtext enthalten ist?

Vielen Dank schon einmal für eure Hilfe!

Marek


RE: dynamisch generierte Webseiten nach text/bild durchsuchen - Wulf - 02.04.2011 14:45

Hast du direkten Zugriff auf die Datenbank?
Hast du herausgefunden, wie du alle 5000 Webseiten generieren bzw. abspeichern kannst?
Verändern sich die Webseiten oder reicht es, wenn du sie einmal abspeicherst?
Suchen kannst du z. B. mit grep oder du programmierst dir ein Programm in perl oder jeden anderen Sprache.


RE: dynamisch generierte Webseiten nach text/bild durchsuchen - Marek Schuller - 02.04.2011 18:48

Hallo.

Also. ich habe keinen direkten DB-Zugriff,
die Dateinamen sind randomisiert und ich sollte mich glaub ich quasi von link zu link hangeln.... mit nem crawler? spider?


RE: dynamisch generierte Webseiten nach text/bild durchsuchen - Wulf - 02.04.2011 19:22

Irgendwie sowas. Es gibt auch Programme, die dir alles von einer Domain runterladen, z.B. wget -r -l 3 URL