Multimedia-Datenfluss am SNSB IT-Zentrum
Multimedia-Datenfluss für Bilder von Sammlungsobjekten
Prozessierung von Bildern:
- Konvertierung in das JPG-Format
- Verkleinerung auf eine Breite von 800 Pixel bei Web und auf 200 Pixel bei Preview
- Normalisierung und Gammakorrektur (optional)
- Umbenennung der Bilder in das Format Belegnummer_Aufnahmedatum_Zeitstempel.Typ
- Ausnahmen für bestimmte Projekte
Prozessierung von Video- und Audio-Dateien
- Es erfolgt keine Konvertierung
- Umbenennung der Dateien in das Format Belegnummer_Aufnahmedatum_Zeitstempel.Typ
- Ausnahmen für bestimmte Projekte
Transfer auf den Media-Server:
- Projektverzeichnis muss existieren
- Unterverzeichnisse werden angelegt, wenn noch nicht vorhanden
- Überprüfung, ob der Transfer geklappt hat
Eintrag in die DiversityCollection Datenbank:
- URL-Adressen der Bilder werden entsprechend Projekt/AccessionNumber in DiversityCollection eingefügt
- Falls der SpecimenRecord mit Belegnummer/AccessionNumber noch nicht existiert, wird er angelegt (optional)
- Bei Angabe einer SpecimenPart-Nummer werden die Bilder dem SpecimenPart zugeordnet
- Im Falle von Beobachtungsdaten (keine AccessionNumber) werden die Dateien der Specimen-ID zugeordnet
Archivierung der Originalbilder:
- Werden in die Archiv-Verzeichnisse der SNSB Storage Units kopiert
- Script für spätere Langzeit-Archivierung im LRZ wird angelegt
Aktuell unterstützte Dateiformate
- Bilder: .tif .tiff .jpg .png (Prozessierung, Import, Archivierung)
- Raw-Dateien: .eip .dng (nur Archivierung)
- Audio: .wav .mp3 (Import, Archivierung)
- Video: .mp4 (Import, Archivierung)
- Text: .txt .tifw (Import, Archivierung)
Anmerkungen:
- .nef Dateien werden nicht archiviert, weil es sich um ein proprietäres Nikon Raw-Format handelt, dessen langfristige Unterstützung nicht gewährleistet ist.
- .tif sollten möglichst unkomprimiert sein.
- .mp4 und andere Videodateien sind abhängig vom verwendeten Codec, es kann nicht gewährleistet werden, dass diese langfristig abgespielt werden können.
Namenskonventionen für Mediadatei-Import
Die Benennung der Original-Mediadateien muss den Konventionen des SNSB IT-Zentrums entsprechen, u. a. da aus ihnen die Belegnummer/AccessionNumber (oder Specimen-ID) in DiversityCollection ersichtlich sein muss:
- Zeichenfolge-Ziffernfolge_Sonstiges.Typ
Die zugehörige Belegnummer/AccessionNumber in der Datenbank wäre in diesem Fall "Zeichenfolge-Ziffernfolge". Ein "_" gilt als Begrenzer für die Ziffernfolge (falls weitere Ziffern folgen, ansonsten wird nach der ersten Nicht-Ziffer die Bestimmung der Belegnummer/AccessionNumber beendet).
Wenn die Belegnummer/AccessionNumber noch nicht existiert, kann unser Import-Script einen leeren Eintrag anlegen und den Mediadateilink dort eintragen, wenn das in den Projekteinstellungen des Scripts so definiert ist.
Beim Prozessieren wird eine Mediadatei umbenannt auf ein genormtes Format:
- Zeichenfolge-Ziffernfolge_Datum_Zeitstempel.Typ
Als Beispiel wären also auch solche Namen ok: REG-005599_1 Potentilla opaca Jacq.01.jpg
Belegnummer/AccessionNumber: "REG-005599"
Der neue Name der Datei wäre in diesem Fall z.B.:
- REG-005599_20100507_180620.jpg
Die Zuordnung zum Originalnamen der Datei wird in einer projektspezifischen Liste gespeichert. Er steht auch in der "Description" des Eintrags in der Datenbank, die alle vorhandenen Meta-Daten enthält.
Zeichenfolge und Ziffernfolge können auch noch per Minus-Zeichen "-" unterteilt sein, z.B.
- ZSM-A-20030950_slide.jpg
- BSPG-1989-012-000174_001 1989 XII 174.tif
Allerdings sollte man Belegnummer/AccessionNumber/Objekt-Identifier in einem Projekt einheitlich gestalten.
Dateien SpecimenParts zuordnen:
Das geht nur, wenn die Parts bereits angelegt wurden (die SpecimenPart-Nummer also bekannt ist).
Im Dateinamen kann die SpecimenPart-Nummer übergeben werden, indem man sie (im hinteren, für die Belegnummer nicht relevanten Bereich) in Klammern einträgt, z.B.:
- ZSM-PIS-012345a_(BayFi 09980)_Beispiel.tif
Die Part-Nummer ist nicht die SpecimenPartID (die wird ja automatisch erzeugt), sondern die SpecimenPart-AccessionNumber (kann auch Leerzeichen enthalten).
Nicht erlaubte Zeichen:
Die Mediadateinamen dürfen folgende Zeichen nicht enthalten, da diese vom Betriebssystem als Spezialzeichen benutzt werden: / \ : * ? " < > |
Siehe auch: GFBio Technical documentation of multimedia data management systems