FB18 - Das Forum für Informatik

fb18.de / Off-Topic / Hard- und Softwarefragen

dynamisch generierte Webseiten nach text/bild durchsuchen

dynamisch generierte Webseiten nach text/bild durchsuchen 2011-04-02 11:59
Marek Schuller
Hallo, ich heisse Marek und bin zur Zeit in der 13. Klasse.
Ein Freund hat mir gesagt, dass ihr mir vielleicht weiterhelfen könnt.

Es geht darum, dass ich heine Webseite habe, die ca. 5000 Seiten mit dynamischem Inhalt und Subseiten generiert (aus einer datenbank). Innerhalb dieser Webseiten soll nun nach einem suchtext oder einem spezifischen Bildlink gesucht werden. Leider ist das, wenn ich das per Hand mache sehr sehr mühsam.

Gibt es da vielleicht eine elegante Möglichkeit, die Seiten automatisch durchsuchen zu lassen und dann z.B. die Seiten ausgeben zu lassen, in welchen der gewünschte Suchtext enthalten ist?

Vielen Dank schon einmal für eure Hilfe!

Marek

RE: dynamisch generierte Webseiten nach text/bild durchsuchen 2011-04-02 14:45
Wulf
Hast du direkten Zugriff auf die Datenbank?
Hast du herausgefunden, wie du alle 5000 Webseiten generieren bzw. abspeichern kannst?
Verändern sich die Webseiten oder reicht es, wenn du sie einmal abspeicherst?
Suchen kannst du z. B. mit grep oder du programmierst dir ein Programm in perl oder jeden anderen Sprache.

RE: dynamisch generierte Webseiten nach text/bild durchsuchen 2011-04-02 18:48
Marek Schuller
Hallo.

Also. ich habe keinen direkten DB-Zugriff,
die Dateinamen sind randomisiert und ich sollte mich glaub ich quasi von link zu link hangeln…. mit nem crawler? spider?

RE: dynamisch generierte Webseiten nach text/bild durchsuchen 2011-04-02 19:22
Wulf
Irgendwie sowas. Es gibt auch Programme, die dir alles von einer Domain runterladen, z.B. wget -r -l 3 URL