SerVus.
Jeder kennt sie, (fast) jeder liebt sie. Die
Internet-Movie-data-Base (>
http://german.imdb.com/ bzw.
http://imdb.com/<)
Kennt irgendwer eine weitere Datenbank für Filme im Internet
bevorzugt suche ich deutsche und englische angebote ;)
ach ja…kostenlos sollt's auch sein.. Armer Student => nix kohle :)
hät ich fast vergessen. ein reines webinterface nützt mir wenig, ich muss die daten aus nen Programm abfragen können.
GreeZ
hät ich fast vergessen. ein reines webinterface nützt mir wenig, ich muss die daten aus nen Programm abfragen können.
Das erscheint mir recht waehlerisch, wenns denn kostenlos sein soll :-)
Vielleicht schaffst du es, die Informationen aus den HTMLs abzufragen. Jeder Film hat eine eindeutige Nummer, die in den URLs auftaucht, mit etwas Bastelei kannst du eventuell gezielt Seiten abrufen.
Sag doch mal als Anregung, was dir fehlt an der IMDB, oder fehlt dir nur der Datenbankzugriff?
Naja, und dann gibts auch noch huebsche tools, mit denen man html auseinanderpfluecken kann (perl, awk, sed &c…)
MoKrates
Naja, und dann gibts auch noch huebsche tools, mit denen man html auseinanderpfluecken kann (perl, awk, sed &c…)
ja..ich könnte webbasierte abfragen machen und dann den HTML-Code analysieren…nur leider is das "illegal". kommt also nich so gut….
OK, das wusste ich nicht.
Hast du die bereitgestellten Informationen denn mal angeschaut? Reichen die nicht?
Das Zitat von DB-SilVerStaR kann man wohl eher als Nutzungsrichtlinie ansehen, denn als verbindliche Bedingungen. Wenn die IMDB ihre Datenbank publiziert, dann kann sie nicht auf der anderen Seite ausschließen das man die Seiten nicht automatisch auswertet. Das wäre die rein rechtliche Seite, nach meinem besten Wissen.
Es kommt IMHO darauf an, nicht auf Teufel komm raus die Seite zu beanspruchen.
Wenn die Daten auf dem FTP liegen, sind sie von da aus wahrscheinlich noch einfacher zu parsen, und die darfst Du doch (wenn ich das richtig verstanden habe nutzen (limited non-commercial), wozu willst Du dann noch die Website abgrasen?
Mir scheint es, Du sollst die Website nicht abgrasen, weil das Traffic macht (eventuell auch noch viel davon), und wenn Du Dir die huebschen Formatierungen nicht ansiehst, muss IMDB nicht teure Rechenzeit verschenden, eben die erst zu generieren.
MoKrates
Wenn die Daten auf dem FTP liegen, sind sie von da aus wahrscheinlich noch einfacher zu parsen,
Jo, richtig schönes CSV-Dateien.
…problem bei den daten auf dem FTP-server is, dass das formated txt files sind. die jeweils gezippt sind.
file size (5 bis glaub ich 30 mb). in diesen dateien sind dann sämmtliche in der DB filme aufgeführt.
es gibt jeweils unterschiedliche zips für die einzelnen informationen (sprich: Actors, directos, usw..)
die DL. zeit ist einfach immer zu lang. auch wenn ein neuer DL der dateien nicht jedesmal nötig ist, empfinde ich es als unverschämt, dass der user beim ersten programmstart dann erstmal 500 mb files runterladen muss..
Von daher scheidet diese Mölglichkeit für mich aus….
die DL. zeit ist einfach immer zu lang. auch wenn ein neuer DL der dateien nicht jedesmal nötig ist, empfinde ich es als unverschämt, dass der user beim ersten programmstart dann erstmal 500 mb files runterladen muss..
Von daher scheidet diese Mölglichkeit für mich aus….
Du willst also mit den Informationen der IMDB eine Filmedatenbank schreiben und anbieten? Nichtkommerziell?
Du kannst die 500 MB ja einfach mit deinem Eigenwerk zusammen anbieten…
Wenn es nicht um oeffentliche Anbieten geht, sondern nur um Eigennutzung (evtl noch Freunde, Familie), dann darfst du meinem Verstaendnis nach immerhin einen eigenen Server aufsetzen, der eben ab und zu die 500 MB zieht und dann die Infos einzeln anbietet (also Einzelabfragen ermoeglicht).
Jo, richtig schönes CSV-Dateien.
Wo siehst Du denn csv-Dateien?
Es gibt ausserdem einen Diffs-Ordner wo die Änderungen drin sind.
Wo siehst Du denn csv-Dateien?
Naja, ob nun Komma oder Tabs…