Cloud hat geschrieben:Aus den persönlichen Homebereichen werden sie doch gar nicht verlinkt, sondern wie alle anderen Tests auch aus dem history-spieletests-Verzeichnis.
Ups, dann war das wohl nur ein Backup, was ich bei wulfman gesehen habe.
Sollte man die Scans auch später verwenden wollen, könnte man sie natürlich auch gleich vernünftig archivieren. Da musst du halt sagen wo und wie du es haben willst.
Einmal müsste man systematisierte Dateinamen und Verzeichnisse benutzen, damit man dies nicht in der Datenbank speichern muss, sondern bei Abruf automatisiert erzeugen kann.
Für die Seite 123 aus Heft 4/1993 also z.B. "./archiv/1993/04/1993-04-123.tif". Bei Sonderheften könnte man dem Erscheinungsmonat ein "S" voranstellen. Ich weiß aber nicht, was es da noch alles für Sonderfälle gegeben hat, müsste mal jemand schauen, der sich damit auskennt.
Zum anderen müsste man schon jetzt anfangen, eine Datenbank mit Informationen über den Seiteninhalt zu füllen:
Zu einer gescannten Seite müssten gespeichert werden:
- Datentyp (PDF oder Scan)
- Jahrgang
- Ausgabe
- Seitennummer
- Rubrik
- Seitentitel
- (Seitentitel 2)
- Klartext des Seiteninhalts
Den Klartext kann man bei PDF-Ausgaben automatisiert extrahieren. Bei Scans kommt das OCR-Ergebnis rein. Hab ich beides schon ausprobiert.
Das ganze ist nur ein Vorschlag von mir, den ich unbedingt erst diskutieren möchte. Gerade die Leute, die sich mit den alten PCP-Inhalten auskennen, sollen bitte mal gründlich überlegen, ob die Struktur so sinnvoll ist.
Wenn wir dann zu einem Ergebnis gekommen sind, kann Chellie daraus ein DB-Schema ableiten und vielleicht ein kleines Web-Frontend basteln mit dem man die DB füllen kann. Alternativ könnte man auch erstmal direkt in die DB schreiben.
Ciao,
Doc SoLo