Archivieren der c’t-Schlagseite

Wer die Schlagseite der c’t genau so gern hat wie ich, wird sich vielleicht über dieses Shellskript freuen, mit dem sich bequem ein vollständiges Offline-Archiv aller bislang veröffentlichten Schlagseiten anlegen (und in Zukunft automatisch erweitern) lässt.

Natürlich unterliegen die Bilder dem Urheberrecht der c’t und sollten auf keinen Fall »zweitverwertet« werden. Aber dennoch: Es ist manchmal ganz hübsch, so etwas offline verfügbar zu haben, und die bisher veröffentlichten 169 Schlagseiten händisch herunterzuladen ist einfach eine hirntote Tätigkeit. So etwas lässt man besser einen Computer erledigen, denn dafür ist er ja da…

#!/bin/sh
# -*- coding: utf-8 -*-
########################################################################
#
# dl-schlagseiten.sh
# Ganz schnell runtergehackt...
#
########################################################################

url_start='http://www.heise.de/ct/schlagseite'
url_file='gross.jpg'
dl_dir='schlagseite'

if [ ! -d "$dl_dir" ]
then
    mkdir "$dl_dir"
fi

set `date '+%Y %-m'`
now_y=$1
now_m=$2
for akt_y in `seq 1998 $now_y`
do
    for akt_m in `seq 1 12`
    do
        if [ $akt_y -lt $now_y -o $akt_m -le $now_m ]
        then
            file_m=`printf %02d $akt_m`
            img_url=$url_start/$akt_y/$akt_m/$url_file
            img_fname=$dl_dir/$akt_y-$file_m.jpg
            if [ ! -f $img_fname ]
            then
                wget $img_url -O $img_fname
            fi
        fi
    done
done

Nein, einen Sonderpreis für ästhetisches Coding gewinnt so ein »schnell hingerotztes« Shellskript nicht, aber es funktioniert ganz hervorragend. Natürlich muss man das Skript nicht über die Zwischenablage in den Editor fummeln, sondern kann es hier herunterladen.

Dieser Beitrag wurde unter Technisches abgelegt und mit , , , , verschlagwortet. Setze ein Lesezeichen auf den Permalink.

6 Antworten zu Archivieren der c’t-Schlagseite

  1. tux. sagt:

    Oh, neues Futter für meinen Server, danke! 🙂

    Obwohl FlashGot uns »Klickibuntifreunden« (pah, als ob!) da einiges an Arbeit sparen könnte. Aber so geht es auch.

  2. Marco sagt:

    Feine Sache, aber erscheint die c’t nicht alle zwei Wochen?

    Da würde dein Skript doch einige Schlagseiten auslassen, wenn du nur Jahr und Monat nutzt.

  3. Arrgh! Klassischer Fall von »Keine Sache ist so einfach, dass ich sie nicht falsch machen kann«. Seit ich die c’t nicht mehr lese, weiß ich nicht mehr, in welchem Intervall sie erscheint.

    Zum Glück sollte eine Anpassung relativ leicht sein… 😉 Die kleine Änderung an der inneren Schleife mit akt_m bekommt hoffentlich jeder hin.

  4. Stevo sagt:

    Ich bin erst jetzt auf dieses Seite und das Skript gestoßen…
    Leider hat heise inzwischen die gesamte Webseitenstruktur geändert.
    Daher mal die Frage: hat jemand die alten Schlagseiten als zip irgendwo?
    Hat jemand ein Skript für die neue Seitenstruktur?
    Danke und viele Grüße

  5. Benjamin S. sagt:

    Ich habe meine analoge in die digitale Version getauscht, d.h. ich habe die Seiten aus Papier gegen JPG und PDF getauscht.
    Dabei ist das Script unter https://github.com/luckyhacky/schlagseite entstanden, dass alle Versionen der Schlagseite von 2012 ab herunterlädt. Aktuell ist es in Python gehalten.

    Weitere Info unter https://www.dev-tec.de/2018/10/28/ct-schlagseite-als-bild-und-pdf/

    Kommentare willkommen.
    Danke an Elias für die Inspiration!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert