CLI Logo

Rohdaten Zugverspätungen

Dies enthält die nahezu Rohdaten von der DB Timetables-API. Wir teilen die Datenbank-Dumps, die intern als Backups verwendet werden. Für die meisten Anwendungsfälle empfehlen wir, diesen Datensatz nicht zu verwenden, sondern stattdessen die geparsten Zugverspätungen zu nutzen. Gute Anwendungsfälle für diesen Datensatz sind:

  • Du brauchst etwas, das in den Rohdaten enthalten ist, aber in den geparsten Daten fehlt
  • Du möchtest zu Bahn-Vorhersage beitragen und musst die Daten als Backup in die Datenbank laden

Wenn Du etwas benötigst, das noch nicht im geparsten Datensatz enthalten ist, denke bitte darüber nach unseren Parser zu erweitern, damit andere davon profitieren können. Wenn du das planst, kontaktiere uns am besten so früh wie möglich.

Datenschema

Die gesammelten XML-Daten von der Timetables-API werden direkt in JSON konvertiert und dann in einer Datenbank gespeichert. Sie sind semantisch identisch mit dem XML. Die Schemadokumentation befindet sich in der Dokumentation der Timetables-API selbst oder alternativ in unserer Implementierung im Quellcode.

Datenformat

Die Timetables-API teilt Daten in Fahrpläne und Echtzeitdaten auf. Wir teilen die Fahrpläne und Echtzeitdaten separat als jährliche .tar Archive von Brotli-komprimierten täglichen .csv Dumps. Zudem enthalten die .tar Archive Hashes, die von unserem Backup-System verwendet werden. Die täglichen .csv Dateien enthalten die JSON-Payload und einige Metadaten. Das Schema wird in den folgenden Tabellen erklärt.

Fahrplan

NameBeschreibung
stop_idInteger: ID der Haltestelle (EVA-Nummer). Siehe Haltestellen
planString: JSON-Daten
Datenschema der Fahrplan Rohdaten.

Echtzeit

NameBeschreibung
stop_idInteger: ID der Haltestelle (EVA-Nummer). Siehe Haltestellen
time_crawledISO 8601 Timestamp: Crawling-Zeitstempel.
changeString: JSON-Daten
Datenschema der Echtzeit Rohdaten.

Datenvollständigkeit

Der Datensatz ist aufgrund von Crawling-Fehlern unvollständig. Fehlende Daten werden im folgenden Data-Paper im Absatz "Completeness and Scope" beschrieben. Das Paper beschreibt zudem auch den Prozess der Datensammlung genau.

Preprint Data Paper

Daten

Die Daten sind in der Mobilithek verfügbar: Du musst eingeloggt sein, um Daten zu sehen und anzufordern.

Fahrplan Rohdaten anfordern Echtzeit Rohdaten anfordern

Der Datensatz enthält jährliche Archive. Neue Archive werden hochgeladen, nachdem das Jahr abgeschlossen ist.

Lizenz

Die Daten sind unter der Open Database License verfügbar. Credits müssen zugeordnet werden an: Bahn-Vorhersage, Deutsche Bahn

Backup laden

Um die Rohdaten in die Datenbank zu laden, folge den Schritten auf GitLab.

Wenn Du ein Problem mit dieser Dokumentation findest, dann öffne doch bitte ein Issue auf GitLab.

Gefördert von:

Logo des Bundesministeriums für Bildung und Forschung

Zeitraum: Sep. 23 - Feb. 24

Logo des Prototypefunds
Logo des Schülerforschungszentrums Südwürttemberg
© 2026 Bahn-Vorhersage ist ein unabhängiger Service. Dieser steht in keiner Verbindung mit der Deutschen Bahn und ihren Tochter-Unternehmen.