vorige nächste Auswahlen
 
Heimat


GEDCOM


Hinweis:
Dieser Text enthält keine konkreten Namen, Adressen, Telefonnummern oder sonstige Informationen, die sich ständig ändern können. Sie finden derartige Informationen aber z.B. auf den WWW-Seiten für deutsche Genealogie.
  1. GEDCOM
    bedeutet "GEnealogical Data COMmunications (format)" = (Format für die) Übertragung genealogischer Daten.
     
  2. Kurzinformation
    GEDCOM bietet keine Organisation für den Austausch, sondern ist ein sehr starker Standard zur Darstellung komplexer genealogischer Daten in einer sequentiellen Datei, die sehr gut für die Datenfernübertragung geeignet ist.

    GEDCOM ist kein Programm, sondern entspricht einer "Zwischensprache" (vgl. Esperanto) für zwei Partnerprogramme, die von Haus aus beliebige Datenstrukturen ("Datensprachen") benutzen, die aber ihre Dateien in das GEDCOM-Format hin- und zurückübersetzen können.

    +-------------------------+      +-------------------------+
    | Programm A am Ort A     |      |     Programm B am Ort B |
    +----------+--------------+      +--------------+----------+
    |benutzt   |übersetzt Da- |      |übersetzt GED-|benutzt   |
    |Datei mit |tenformat A in|      |COM-Format in |Datei mit |
    |Struktur A|GEDCOM-Format |      |Datenformat B |Struktur B|
    +----------+--------------+ ===> +--------------+----------+
                   Übertragung der GEDCOM-Datei
    

    Die Entwicklung von GEDCOM begann ca. 1984. Treibende Kraft war und ist die Kirche Jesu Christi der Heiligen der Letzten Tage (Church of Jesus Christ of Latter-day Saints, LDS-Kirche, "Mormonen").
    Die meisten Forscherprogramme bieten die Übersetzung ihrer Daten in das und aus dem GEDCOM-Format an.
    Achte bitte beim Kauf eines genealogischen Programmes darauf, ob es diese Übersetzungsfähigkeit hat und ob es eine GEDCOM-Datei mit Ihren eigenen Dateien abgleichen/integrieren kann.
     
  3. Struktur einer GEDCOM-Datei
    GEDCOM organisiert Personen- und Familiendaten in "hierarchischen Ebenen". Zur Bezeichnung der Datentypen verwendet es spezifische Feldbezeichner (Schlüsselwörter), und zwischen Personendaten und Familiendaten bestehen Verweise ("Zeiger").
    Jedem Datenelement ist seine Ebenen-Nummer (0, 1, ...) und sein Feldbezeichner vorangestellt. Beispiele für Feldbezeichner sind:
       HEAD = [Header]          Kopfteil der GEDCOM-Datei
       SUBM = [Submitter]       Einreicher (der GEDCOM-Datei)
       INDI = [Individual]      Individuum, Person
       FAMS = [Family-Spouses]  (Ehe-)Paar, dessen Bestandteil das
                                Individuum ist
       FAMC = [Family-Children] Liste der Geschwister, zu welchen
                                das Individuum gehört
       BIRT = [Birth]           Geburt
       MARR = [Marriage]        Heirat
       ...
       TRLR = [Trailer=] Endmarke der GEDCOM-Datei
    
    Jedes Datenelement belegt eine eigene Zeile.
    Die höchste Ebene ist 0. Jedes Datenelement der Ebene 1 gehört zum vorangegangenen Datenelement der Ebene 0, und jedes Datenelement der Ebene 2 gehört zum vorangegangenen Datenelement der Ebene 1.
    Auf der obersten logischen Ebene (= Ebene 0) beginnt jeweils ein neuer Satz (HEAD = Kopfsatz, INDI = Personensatz, FAMI = Familiensatz), und dahinter folgen auf den Ebenen 1, und 2 die Datenelemente dieses Satzes, bis der nächste Satz wieder mit Ebene 0 beginnt.
     
  4. Beispiel für eine kleine GEDCOM-Datei
    In der nun folgenden Beispieldatei habe ich die Ebenen durch Einrückungen etwas deutlicher dargestellt (diese Einrückungen sind normalerweise nicht vorhanden), und außerdem habe ich für Referenzen zwischen Personen und Familien auf der rechten Seite Pfeile angebracht (sie sind nicht Bestandteil der GEDCOM-Datei).

    Diese GEDCOM-Datei wird im Abschnitt danach erläutert.

    0 HEAD
      1 GEDC
        2 VERS 5.5
      ...
      1 SUBM @SUB1@                >-----+
                                         |
    0 @SUB1@ SUBM                  <-----+
      1 NAME Xaver Xylander
      1 ADDR Hauptweg 1
        2 CONT D-70003 Stuttgart
    
    0 @I1@ INDI                    >-------------------------------+
      1 NAME Pia /Pirk/                                            |
      1 SEX F                                                    (I1)
      1 FAMS @F1@                     >-------------------------+  |
    0 @I2@ INDI                    >-------------------------+  |  |
      1 NAME Michael /Mustermann/                            |  |  |
      1 SEX M                                                | (F1)|
      1 BIRT                                                 |  |  |
        2 DATE 13.10.1954                                   (I2)|  |
        2 PLAC Stuttgart                                     |  |  |
      1 OCCU Ingenieur                                       |  |  |
      1 FAMS @F1@                     >----------------------|--+  |
      1 FAMC @F2@                     >-------------------+  |  |  |
    0 @I3@ INDI                    >-------------------+  |  |  |  |
      1 NAME Viktor /Mustermann/                       | (F2)|  |  |
      ...                                              |  |  |  |  |
      1 FAMS @F2@                     >----------------|--+  |  |  |
    0 @I4@ INDI                    >-------------+     |  |  |  |  |
      1 NAME Maria /Mangold/                     |    (I3)|  |  |  |
      ...                                       (I4)   |  |  |  |  |
      1 FAMS @F2@                     >----------|-----|--+  |  |  |
    0 @I5@ INDI                    >----------+  |     |  |  |  |  |
      1 NAME Konrad /Mustermann/             (I5)|     |  |  |  |  |
      1 SEX M                                 |  |     |  |  |  |  |
      1 FAMC @F1@                     >-------|--|-----|--|--|--+  |
                                              |  |     |  |  |  |  |
    0 @F1@ FAM                     <----------|--|-----|--|--|--+  |
      1 HUSB @I2@                     <-------|--|-----|--|--+     |
      1 WIFE @I1@                     <-------|--|-----|--|--|-----+
      1 CHIL @I5@                     <-------+  |     |  |  |
      1 MARR                                     |     |  |  |
        2 DATE 01.09.1978                        |     |  |  |
        2 PLAC Filderstadt                       |     |  |  |
    0 @F2@ FAM                     <-------------|-----|--+  |
      1 HUSB @I3@                     <----------|-----+     |
      1 WIFE @I4@                     <----------+           |
      1 CHIL @I2@                     <----------------------+
      ...
    0 TRLR
    

     
  5. Einige Erläuterungen zur obigen kleinen GEDCOM-Beispieldatei
    0 HEAD: Ein neuer Satz (Ebene 0) beginnt, und zwar der
            Kopfsatz (HEAD[er]).
    1 GEDC: Die GEDCOM-Datei entspricht der
    2 VERS: GEDCOM-Version 5.5.
    1 SUBM: nennt den Namen des Einreicher-Satzes; hier: @SUB1@.
    
    0 @SUB1@ SUBM:
            Hier folgt der Einreichersatz namens @SUB1@ mit den
            Daten zum Einreicher der GEDCOM-Datei.
    1 NAME: Sein Name ist Xaver Xylander.
    1 ADDR: Seine Adresse: Hauptweg 1.
    2 CONT: Fortsetzung (CONT[inuation]); hier: der Adresse.
    
    0 @I1@ INDI:
            Es beginnt ein neuer Satz, und zwar für eine
            Einzel-Person (INDI[vidual]), die hier vom
            Erstellungsprogramm der GEDCOM-Datei die beliebige
            eindeutige Referenz namens @I1@ bekam (wird immer
            zwischen zwei @-Zeichen gesetzt).
            Person @I1@ heißt Pia Pirk [(Nachname(n) generell
            zwischen zwei Schrägstrichen], ist weiblich (f[emale]),
            und ihr Familien-Ehepaar-Satz hat hier die eindeutige
            Referenz @F1@ (siehe weiter unten!).
    
    0 @I2@ INDI
            Satz einer weiteren Person, hier mit der Referenz @I2@,
            namens Michael Mustermann, männlich, geboren am Datum
            13.10.1954, am Ort (PLAC[e]) Stuttgar, von Beruf
            (OCCU[pation]) Ingenieur.
    1 FAMS @F1@:
            Der Familiensatz mit Angaben zu dem Ehepaar (zu dem er
            gehört) hat hier die eindeutige Referenz @F1@ bekommen
            (siehe weiter unten!).
    1 FAMC @F2@:
            Der Familiensatz, in dem die Person @I2@ ein Kind ist,
            hat hier die eindeutige Referenz @F2@ bekommen (siehe
            weiter unten!).
    
    0 @I3@ INDI
            Satz einer weiteren Person, hier mit der Referenz @I3@,
            namens Viktor Mustermann.
    1 FAMS @F2@:
            Er (und seine Ehegattin) sind im Familiensatz mit der
            eindeutigen Referenz @F2@ aufgeführt (siehe unten!).
    
    0 @I4@ INDI
            Satz einer weiteren Person, hier mit der Referenz @I4@,
            namens Maria Mangold.
    1 FAMS @F2@:
            Sie (und ihr Ehegatte) sind
            im Familiensatz mit der eindeutigen Referenz @F2@
            aufgeführt (siehe weiter unten!).
    
    0 @I5@ INDI
            Satz einer weiteren Person, hier mit der Referenz @I5@,
            namens Konrad Mustermann, männlich.
    1 FAMS @F2@:
            Er ist im Familiensatz mit der eindeutigen Referenz @F1@
            als Kind aufgeführt (siehe weiter unten!).
    
    0 @F1@ FAM:
            Neuer Satz (Ebene 0), und zwar der Familiensatz mit der
            Referenz @F1@.
            Er besagt, dass in dieser Familie folgende Personen
            angegeben sind:
            der Gatte (HUSB[and]) ist die Person mit der Referenz
            @I2@ (siehe oben, also Michael Mustermann),
            die Gattin (WIFE) @I1@ (siehe oben, also Person Pia
            Pirk),
            ein Kind (CHIL[d]) @I5@ (siehe oben, also Person Konrad
            Mustermann).
            Die Heirat (MARR[iage]) der Gatten war am 01.09.1987 am
            Ort (PLAC[e]) Filderstadt.
    
    0 @F2@ FAM:
            Neuer Satz (Ebene 0), und zwar der Familiensatz mit der
            Referenz @F2@.
            Er besagt, dass in dieser Familie folgende Personen
            angegeben sind:
            der Gatte (HUSB[and]) ist die Person mit der Referenz
            @I3@ (siehe oben, also Viktor Mustermann),
            die Gattin (WIFE) @I4@ (siehe oben, also Person Maria
            Mangold),
            ein Kind (CHIL[d]) @I2@ (siehe oben, also Person Michael
            Mustermann).
    
    0 TRLR: Endmarke (TR[ai]L[e]R) dieser Gedcom-Datei.
    

    Es handelt sich also bei dieser GEDCOM-Datei um einen Konrad Mustermann, um seine Eltern Michael Mustermann und Pia geb. Pirk, sowie um seine vaäterlichen Großeltern Viktor Mustermann und Maria geb. Mangold.
     
    Wie Du siehst, brauchen nicht immer alle Daten bekannt zu sein. Was nicht bekannt ist, steht halt nicht im Satz. Die Datenfelder sind variabel lang; sie gehen maximal bis zum Zeilenende. Jedes Datenfeld belegt eine eigene Zeile.
     
  6. Voraussetzungen für den Benutzer
    Konvertierungsprogramm, das die genealogische Datenbank eines genealogischen Forscherprogrammes in eine GEDCOM-Datei umwandelt, und umgekehrt. (sollte Bestandteil des jeweiligen genealogischen Forscherprogrammes sein).
    Bitte beim Erwerb von Programmen darauf achten.
     
  7. Stärken von GEDCOM
    • Anzahl, Typen, Folge und Länge der Daten innerhalb der Sätze sind in ihrer Verwendbarkeit frei (soweit die Hierarchie-Ebenen und die Feldbezeichner richtig sind)
    • zuküftige neue Datensätze und/oder Datentypen erfordern keine Änderung bisheriger GEDCOM-Dateien (falls z.B. in GEDCOM Version 6 eine Personennummer eingeführt wird, benutzt man einen neuen Feldbezeichner (z.B. UPID) dafür, aber die bisherigen Dateisätze können unverändert bleiben)
    • Das GEDCOM-Format ist für Einzelpersonen (verwandt und/oder nicht verwandt) wie auch für Familienverbände geeignet, da das GEDCOM-Format verwandtschaftliche Beziehungen angeben kann. Es kann daher auch zur Darstellung ganzer Populationen (z.B. alle ehemaligen und jetzigen Einwohner der Stadt Stuttgart, alle gesammelten Ahnendaten der VSFF = Vereinigung Sudetendeutscher Familienforscher) verwendet werden
    • günstig für Datenfernübertragung und Datenfernverarbeitung.

  8. Schwächen von GEDCOM oder seines Einsatzes
    • Feldbezeichner sind aus der englischen Sprache übernommen (ist andererseits für internationale Verbreitung günstig)
    • manche kostengünstige Programme (aus USA), die GEDCOM nutzen, lassen keine deutschen Umlaute zu
    • GEDCOM-Dateien sind wegen der Referenzen nicht leicht als Klartext lesbar (aber für maschinelle Verarbeitung gut geeignet)
    • GEDCOM ist ein Format, aber keine Organisation zum Sammeln und Koordinieren von Ahnendaten (aber jedes Programm kann diesen Standard integrieren, jede Organisation könnte GEDCOM-Dateien sammeln und weiterverarbeiten)
    • GEDCOM braucht viele Steuerzeichen (Ebenen-Zahl, Feldbezeichner)
    • Suchbegriffe und Suchfunktionen für Datenfelder (wie bei indizierten Dateien) sind bei GEDCOM nicht vorgesehen.
 
  Es gibt einen deutschen Server für kooperativ gesammelte GEDCOM-Daten unter http://gedbas.genealogy.net/.  
 
vorige nächste Auswahlen
Ewald Keil, ekeil@gmx.de (20080819)
(d-ged)