Multimedia-Datenfluss am SNSB IT-Zentrum

Aus IDES Wiki (Integriertes Datenmanagement für die digitale Erschließung zoologischer und paläontologischer Sammlungsbestände)
Wechseln zu: Navigation, Suche

Multimedia-Datenfluss für Bilder von Sammlungsobjekten


Prozessierung von Bildern:

  • Konvertierung in das JPG-Format
  • Verkleinerung auf eine Breite von 800 Pixel bei Web und auf 200 Pixel bei Preview
  • Normalisierung und Gammakorrektur (optional)
  • Umbenennung der Bilder in das Format Belegnummer_Aufnahmedatum_Zeitstempel.Typ
  • Ausnahmen für bestimmte Projekte

Prozessierung von Video- und Audio-Dateien

  • Es erfolgt keine Konvertierung
  • Umbenennung der Dateien in das Format Belegnummer_Aufnahmedatum_Zeitstempel.Typ
  • Ausnahmen für bestimmte Projekte

Transfer auf den Media-Server:

  • Projektverzeichnis muss existieren
  • Unterverzeichnisse werden angelegt, wenn noch nicht vorhanden
  • Überprüfung, ob der Transfer geklappt hat

Eintrag in die DiversityCollection Datenbank:

  • URL-Adressen der Bilder werden entsprechend Projekt/AccessionNumber in DiversityCollection eingefügt
  • Falls der SpecimenRecord mit Belegnummer/AccessionNumber noch nicht existiert, wird er angelegt (optional)
  • Bei Angabe einer SpecimenPart-Nummer werden die Bilder dem SpecimenPart zugeordnet
  • Im Falle von Beobachtungsdaten (keine AccessionNumber) werden die Dateien der Specimen-ID zugeordnet

Archivierung der Originalbilder:

  • Werden in die Archiv-Verzeichnisse der SNSB Storage Units kopiert
  • Script für spätere Langzeit-Archivierung im LRZ wird angelegt

Aktuell unterstützte Dateiformate

  • Bilder: .tif .tiff .jpg .png (Prozessierung, Import, Archivierung)
  • Raw-Dateien: .eip .dng (nur Archivierung)
  • Audio: .wav .mp3 (Import, Archivierung)
  • Video: .mp4 (Import, Archivierung)
  • Text: .txt .tifw (Import, Archivierung)

Anmerkungen:

  • .nef Dateien werden nicht archiviert, weil es sich um ein proprietäres Nikon Raw-Format handelt, dessen langfristige Unterstützung nicht gewährleistet ist.
  • .tif sollten möglichst unkomprimiert sein.
  • .mp4 und andere Videodateien sind abhängig vom verwendeten Codec, es kann nicht gewährleistet werden, dass diese langfristig abgespielt werden können.




Namenskonventionen für Mediadatei-Import

Die Benennung der Original-Mediadateien muss den Konventionen des SNSB IT-Zentrums entsprechen, u. a. da aus ihnen die Belegnummer/AccessionNumber (oder Specimen-ID) in DiversityCollection ersichtlich sein muss:

  • Zeichenfolge-Ziffernfolge_Sonstiges.Typ

Die zugehörige Belegnummer/AccessionNumber in der Datenbank wäre in diesem Fall "Zeichenfolge-Ziffernfolge". Ein "_" gilt als Begrenzer für die Ziffernfolge (falls weitere Ziffern folgen, ansonsten wird nach der ersten Nicht-Ziffer die Bestimmung der Belegnummer/AccessionNumber beendet).

Wenn die Belegnummer/AccessionNumber noch nicht existiert, kann unser Import-Script einen leeren Eintrag anlegen und den Mediadateilink dort eintragen, wenn das in den Projekteinstellungen des Scripts so definiert ist.

Beim Prozessieren wird eine Mediadatei umbenannt auf ein genormtes Format:

  • Zeichenfolge-Ziffernfolge_Datum_Zeitstempel.Typ

Als Beispiel wären also auch solche Namen ok: REG-005599_1 Potentilla opaca Jacq.01.jpg

Belegnummer/AccessionNumber: "REG-005599"

Der neue Name der Datei wäre in diesem Fall z.B.:

  • REG-005599_20100507_180620.jpg

Die Zuordnung zum Originalnamen der Datei wird in einer projektspezifischen Liste gespeichert. Er steht auch in der "Description" des Eintrags in der Datenbank, die alle vorhandenen Meta-Daten enthält.

Zeichenfolge und Ziffernfolge können auch noch per Minus-Zeichen "-" unterteilt sein, z.B.

  • ZSM-A-20030950_slide.jpg
  • BSPG-1989-012-000174_001 1989 XII 174.tif

Allerdings sollte man Belegnummer/AccessionNumber/Objekt-Identifier in einem Projekt einheitlich gestalten.

Dateien SpecimenParts zuordnen:

Das geht nur, wenn die Parts bereits angelegt wurden (die SpecimenPart-Nummer also bekannt ist).

Im Dateinamen kann die SpecimenPart-Nummer übergeben werden, indem man sie (im hinteren, für die Belegnummer nicht relevanten Bereich) in Klammern einträgt, z.B.:

  • ZSM-PIS-012345a_(BayFi 09980)_Beispiel.tif

Die Part-Nummer ist nicht die SpecimenPartID (die wird ja automatisch erzeugt), sondern die SpecimenPart-AccessionNumber (kann auch Leerzeichen enthalten).

Nicht erlaubte Zeichen:

Die Mediadateinamen dürfen folgende Zeichen nicht enthalten, da diese vom Betriebssystem als Spezialzeichen benutzt werden: / \ : * ? " < > |


Siehe auch: GFBio Technical documentation of multimedia data management systems