Multimedia-Datenfluss am SNSB IT-Zentrum: Unterschied zwischen den Versionen

Aus IDES Wiki (Integriertes Datenmanagement für die digitale Erschließung zoologischer und paläontologischer Sammlungsbestände)
Wechseln zu: Navigation, Suche
Zeile 21: Zeile 21:
 
'''Eintrag in die DiversityCollection Datenbank:'''
 
'''Eintrag in die DiversityCollection Datenbank:'''
 
* URL-Adressen der Bilder werden entsprechend Projekt/AccessionNumber in DiversityCollection eingefügt
 
* URL-Adressen der Bilder werden entsprechend Projekt/AccessionNumber in DiversityCollection eingefügt
* Falls der SpecimenRecord mit Belegnummer/AccessionNumber noch nicht existiert, wird er angelegt
+
* Falls der SpecimenRecord mit Belegnummer/AccessionNumber noch nicht existiert, wird er angelegt
 
* Bei Angabe einer SpecimenPart-Nummer werden die Bilder dem SpecimenPart zugeordnet
 
* Bei Angabe einer SpecimenPart-Nummer werden die Bilder dem SpecimenPart zugeordnet
  
Zeile 34: Zeile 34:
 
<big>'''Namenskonventionen für Bilder-Import'''</big>
 
<big>'''Namenskonventionen für Bilder-Import'''</big>
  
Die Benennung der Bilder muss den Konventionen des SNSB IT-Zentrums entsprechen, u. a. da aus ihnen die ''Belegnummer/AccessionNumber''' in DiversityCollection ersichtlich sein muss:  
+
Die Benennung der Bilder muss den Konventionen des SNSB IT-Zentrums entsprechen, u. a. da aus ihnen die '''Belegnummer/AccessionNumber''' in DiversityCollection ersichtlich sein muss:  
 
* '''Zeichenfolge'''-'''Ziffernfolge'''_Sonstiges.'''Typ'''
 
* '''Zeichenfolge'''-'''Ziffernfolge'''_Sonstiges.'''Typ'''
  
Zeile 58: Zeile 58:
 
* '''ZSM-A-20030950_slide.jpg'''
 
* '''ZSM-A-20030950_slide.jpg'''
 
* '''BSPG-1989-012-000174_001 1989 XII 174.tif'''
 
* '''BSPG-1989-012-000174_001 1989 XII 174.tif'''
Allerdings sollte man die Belegnummer/AccessionNumber/Objekt-Identifier in einem Projekt einheitlich gestalten.
+
Allerdings sollte man Belegnummer/AccessionNumber/Objekt-Identifier in einem Projekt einheitlich gestalten.
  
 
'''Bilder SpecimenParts zuordnen:'''
 
'''Bilder SpecimenParts zuordnen:'''
Zeile 69: Zeile 69:
 
Die Part-Nummer ist '''nicht''' die SpecimenPartID (die wird ja automatisch erzeugt), sondern die SpecimenPart-AccessionNumber (kann auch Leerzeichen enthalten).
 
Die Part-Nummer ist '''nicht''' die SpecimenPartID (die wird ja automatisch erzeugt), sondern die SpecimenPart-AccessionNumber (kann auch Leerzeichen enthalten).
  
 +
'''Nicht erlaubte Zeichen:'''
  
-----
+
Die Bildernamen (Dateinamen) dürfen folgende Zeichen nicht enthalten, da diese vom Betriebssystem als Spezialzeichen benutzt werden:  / \ : * ? " < > |
 
+
 
+
<big>'''Ausblick'''</big>
+
 
+
In Zukunft sollen die Namenskonventionen
+
* '''projektspezifisch definiert''' und
+
* '''enger gefasst''' werden.
+
Das hat den Vorteil, dass Schreibfehler bei der Benennung frühzeitig erkannt werden und das Anlegen falscher Belege verhindert werden kann. Für diesen Zweck wird derzeit ein Validierungsprogramm entwickelt, das die eingehenden Bilder hinsichtlich der '''projektspezifischen''' Namenskonventionen überprüft. Dies geschieht mit "'''regular expressions'''", die für jedes Projekt unterschiedlich definiert werden können.
+
 
+
'''Beispiele:'''
+
* '''ZSMpiscescoll''': Die Namen fangen alle mit "ZSM-PIS-" an, danach kommen exakt 6 Ziffern, dann ein Unterstrich, im darauffolgenden Text dürfen "(" gefolgt von ")" stehen, der Text darin kann aus Zeichen und Ziffern bestehen, die dann als SpecimenPart-Nummer interpretiert werden.
+
* '''Morphyllcoll''': Die Namen beginnen entweder mit "GDKE_", SMSN_" oder "MMG_", danach kommen Großbuchstaben, gefolgt von Ziffern, die durch Minuszeichen getrennt sein dürfen..." usw...
+

Version vom 4. September 2015, 10:06 Uhr

Multimedia-Datenfluss für Bilder von Sammlungsobjekten


Prozessierung von Bildern:

  • Konvertierung in das JPG-Format
  • Verkleinerung auf eine Breite von 800 Pixel bei Web und auf 200 Pixel bei Preview
  • Normalisierung und Gammakorrektur
  • Umbenennung der Bilder in das Format Belegnummer_Aufnahmedatum_Zeitstempel.Typ
  • Ausnahmen für bestimmte Projekte

Transfer auf den Bilder-Server:

  • Projektverzeichnis muss existieren
  • Unterverzeichnisse werden angelegt, wenn noch nicht vorhanden
  • Überprüfung, ob der Transfer geklappt hat

Eintrag in die DiversityCollection Datenbank:

  • URL-Adressen der Bilder werden entsprechend Projekt/AccessionNumber in DiversityCollection eingefügt
  • Falls der SpecimenRecord mit Belegnummer/AccessionNumber noch nicht existiert, wird er angelegt
  • Bei Angabe einer SpecimenPart-Nummer werden die Bilder dem SpecimenPart zugeordnet

Archivierung der Originalbilder:

  • Werden in die Archiv-Verzeichnisse von Server und Storage Units kopiert
  • Script für spätere Langzeit-Archivierung im LRZ wird angelegt




Namenskonventionen für Bilder-Import

Die Benennung der Bilder muss den Konventionen des SNSB IT-Zentrums entsprechen, u. a. da aus ihnen die Belegnummer/AccessionNumber in DiversityCollection ersichtlich sein muss:

  • Zeichenfolge-Ziffernfolge_Sonstiges.Typ

Die zugehörige Belegnummer/AccessionNumber in der Datenbank wäre in diesem Fall "Zeichenfolge-Ziffernfolge". Ein "_" gilt als Begrenzer für die Ziffernfolge (falls weitere Ziffern folgen, ansonsten wird nach der ersten Nicht-Ziffer die Bestimmung der Belegnummer/AccessionNumber beendet).

Wenn die Belegnummer/AccessionNumber noch nicht existiert, legt unser Import-Script einen leeren Eintrag an und trägt den Bilderlink dort ein.

Beim Prozessieren wird das Bild umbenannt auf unser genormtes Format:

  • Zeichenfolge-Ziffernfolge_Datum_Zeitstempel.Typ

Als Beispiel wären also auch solche Namen ok: REG-005599_1 Potentilla opaca Jacq..jpg

Belegnummer/AccessionNumber: "REG-005599"

Der neue Name des Bildes wäre in diesem Fall z.B.:

  • REG-005599_20100507_180620.jpg

Die Zuordnung zum Originalnamen des Bildes wird in einer projektspezifischen Liste gespeichert. Er steht auch in der "ImageDescription" des Bildes in der Datenbank, die alle vorhandenen Meta-Daten enthält.

Zeichenfolge und Ziffernfolge können auch noch per Minus-Zeichen "-" unterteilt sein, z.B.

  • ZSM-A-20030950_slide.jpg
  • BSPG-1989-012-000174_001 1989 XII 174.tif

Allerdings sollte man Belegnummer/AccessionNumber/Objekt-Identifier in einem Projekt einheitlich gestalten.

Bilder SpecimenParts zuordnen:

Das geht nur, wenn die Parts bereits angelegt wurden (die SpecimenPart-Nummer also bekannt ist).

Im Bildernamen kann die SpecimenPart-Nummer übergeben werden, indem man sie (im hinteren, für die Belegnummer nicht relevanten Bereich) in Klammern einträgt, z.B.:

  • ZSM-PIS-012345a_(BayFi 09980)_Beispiel.tif

Die Part-Nummer ist nicht die SpecimenPartID (die wird ja automatisch erzeugt), sondern die SpecimenPart-AccessionNumber (kann auch Leerzeichen enthalten).

Nicht erlaubte Zeichen:

Die Bildernamen (Dateinamen) dürfen folgende Zeichen nicht enthalten, da diese vom Betriebssystem als Spezialzeichen benutzt werden: / \ : * ? " < > |