Liebe Leser,
Wenn dies Ihr erster Besuch hier ist, lesen Sie bitte zuerst die Hilfe - Häufig gestellte Fragen durch. Sie müssen sich vermutlich registrieren, bevor Sie Beiträge verfassen können. Klicken Sie rechts auf 'Jetzt registrieren.', um den Registrierungsprozess zu starten.
Ergebnis 1 bis 5 von 5
  1. #1
    Registriert seit
    01.2011
    Beiträge
    3

    Frage Dateien aus dem Web downloaden

    Hallo zusammen,

    ich würde gerne die Dateien (PDF-Dateien), die unter folgendem Link in einem Verzeichnisbaum stehen:

    http://www.etsi.org/deliver/

    abgleichen, um nicht alle Dateien einzeln kopieren zu müssen. Ich hatte auch schon einige Programme ausprobiert, die aber alle nicht den Erfolg gebracht haben. Wer kann mir da evtl. Tipps geben.

    Besten Dank und viele Grüsse

    Juergen

  2. #2
    Registriert seit
    04.2000
    Beiträge
    26.645
    Lade den ganzen Schwung mit "wget" (Parameter -r) herunter.
    You get out what you put in.

    Hinweis: Außerhalb der Technik werden ironische Textabschnitte nicht immer gesondert gekennzeichnet.

  3. #3
    Registriert seit
    01.2011
    Beiträge
    3

    Frage Dateien aus dem Web downloaden / syncronisieren

    Hallo kalweit,

    das Wget Programm ist ja wirklich nett, jedoch geht es er immer nur eine Ebene weiter und erstellt dann von dem nächsten Verzeichnis eine index.html Datei, in der alles drin steht und bricht ab mit der Syncronisierung, auch bei "-r". Erst wenn ich den vollen Pfad mit Datei-Name angebe kopiert er die Datei mit wget. Gibt es da eine andere Lösung wie man das automatisieren kann oder mach ich da doch etwas falsch.

    Vielleicht kann mal jemand prüfen ob er die Dateien so runter kopieren kann?

    Vielen Dank für eure Hilfe

    Gruss

    Jürgen

  4. #4
    Avatar von kazhar
    kazhar ist offline Viertel Gigabyte
    Mein System
    Mainboardirgendwas mit GM45 Chipsatz
    ProzessorIntel Core 2 Duo Mobile P9500
    GrafikkarteMobile Intel GMA 4500MHD
    RAM2x PSD24G8002S
    Festplatte(n)Seagate Momentus XT 750GB
    Andere LaufwerkeLG HL-DT-ST BD-RE BT10N, Romex SCSI 4GB
    Netzteil (inkl. Spannungswerte)NSW 24199 100-240V~ 1.3A 15V= 5A
    SoundkarteRealtek
    BetriebssystemWinXP Professional SP3
    AV-Softwareavast!
    Monitor14.1" WXGA 1280 x 800
    Registriert seit
    06.2001
    Beiträge
    3.790
    du machst nichts falsch. wget hält sich an die robots.txt (weils halt ein automatischer downloader ist) und die verbietet das runterladen mit "robots"

    du musst wget "sagen", dass es die robots.txt ignorieren soll
    wget --execute robots=off --no-parent --mirror http://www.etsi.org/deliver/
    ...Spezialist mit Spezialkenntnissen...

  5. #5
    Registriert seit
    01.2011
    Beiträge
    3

    Daumen hoch Dateien aus dem Web downloaden / syncronisieren

    Hallo Kazhar,

    besten Dank funktioniert einwandfrei. Ich dachte das mit den Robots bezieht sich nur auf die Crawler der Suchmaschinen.
    Suoper vielen Dank für deine/eure Hilfe.

    Viele Grüsse

    Jürgen

Stichworte

Lesezeichen

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •  
12
Content Management by InterRed