Offene, historische Bahn-Daten
Wir haben für dieses Projekt eine große Menge an Daten gesammelt und zusammengeführt. Die Daten umfassen vergangene Zugverspätungen sowie begleitende Informationen wie Haltestellen und Betreiber. Mit den Daten lassen sich Bahn-Statistiken erstellen, Verspätungen im Nachhinein analysieren bzw. lässt sich alles damit machen, wofür man einen Datensatz über vergangene Zugverspätungen braucht.
Wir teilen diese Verspätungsdaten, um andere Projekte sowie Forschung zu Zugverspätungen zu unterstützen. Neue Projekte verbringen oft den Großteil ihrer Zeit damit, Daten zu sammeln, anstatt nützliche Funktionen zu entwickeln oder zu erforschen. Die Bereitstellung der Daten erfolgt unter dem Motto best effort; wir können keine Vollständigkeit oder Korrektheit garantieren und tragen keinerlei Verantwortung.
Wir teilen die folgenden Datensätze:
Haltestellen (ODbL)
Wir haben ein Archiv mit Metainformationen über Zughalte gesammelt, einschließlich Geokoordinaten, Namensänderungen und stillgelegter Haltestellen.
HaltestellenOperator-Codes
Die Timetables-API (IRIS) der Deutschen Bahn liefert Informationen darüber, welches Unternehmen einen Zug betreibt. Betreiber werden allerdings als Codes zurückgegeben, nicht als menschenlesbare Namen. Wir pflegen eine Zuordnung von Codes zu Namen auf GitLab. Die von HAFAS verwendeten Codes sind nahezu identisch, sodass diese Zuordnung auch nützlich sein kann, wenn Sie die Timetables-API nicht direkt verwenden.
Operator-CodesGeparste Zugverspätungen (ODbL) Empfohlen
Geparste Zugverspätungen im Parquet-Format inklusive geschätzter Reisedistanzen. Veröffentlicht in jährlichen Paketen.
Geparste ZugverspätungenRohdaten Zugverspätungen (ODbL) Für Abenteuerlustige
Nahezu Rohdaten zu Zugverspätungen, gesammelt von der Timetables-API (IRIS). verteilt als Brotli-komprimierte CSV-Datenbank-Dumps. Die Daten sind in Fahrpläne und Echtzeitinformationen aufgeteilt. Die Dumps enthalten einige Informationen, die im geparsten Datensatz nicht vorhanden sind, aber Daten aus externen Quellen fehlen. Das Rohdatenformat ist schwierig zu verwenden. Für die meisten Anwendungsfälle empfehlen wir wirklich die Verwendung der schon geparsten Daten.
Rohdaten Zugverspätungen