Pascal Hennen zum PhD promoviert

Am Montag, den 09. Februar 2026, verteidigte Pascal Hennen seine Dissertation mit dem Titel: „Eine empirische Bewertung unstrukturierter BGP-Datenquellen”. Von Januar 2023 bis Dezember 2025 war er Doktorand am Max-Planck-Institut für Informatik unter der Betreuung von Prof. Anja Feldmann, Leiterin der Abteilung „Internet Architecture”. Der Doktorgrad wird von der Universität des Saarlandes verliehen.

Zusammenfassung der Dissertationsschrift:

Das Internet ist das weltweit größte von Menschen geschaffene System und hat sich als solches zu einem komplexen Gebilde entwickelt. Betreiber nutzen das Border Gateway Protokoll (BGP) – das de-facto verwendete Inter-AS-Routing-Protokoll des Internets – um globale Konnektivität zu ermöglichen. Das Routing im Internet entwickelt sich jedoch weiter. Obwohl sich die Spezifikation von BGP seit Jahrzehnten nicht geändert hat, haben sich seine Ergänzungen und Nutzungsmuster gewandelt. Daher ist BGP zu einem wichtigen Forschungsthema geworden. Forscher nutzen BGP-Daten beispielsweise, um Routing-Entscheidungen zu verstehen, die Topologie des Internets zu messen, und Routing sicher zu gestalten. Jedes Autonome System (AS) verwendet BGP, um seine Richtlinien auf der Grundlage der Geschäftsvereinbarungen mit seinen benachbarten ASes umzusetzen. ASes geben ihre Geschäftsvereinbarungen in der Regel nicht öffentlich bekannt. Dennoch müssen ASes die Auswirkungen einer Änderung ihrer BGP-Konfiguration erkennen können. Routensammler Projekte wie RouteViews und RIPE RIS sammeln BGP-Daten von so vielen ASes wie möglich und machen diese Daten in BGP-Archiven öffentlich zugänglich. Darüber hinaus bieten Datenbrokerdienste Schnittstellen zu diesen BGP-Archiven. 

Während Betreiber diese Daten zur Optimierung ihrer Netzwerke nutzen, verwenden Forscher sie häufig, um das Routing-Ökosystem zu untersuchen und zu verstehen. Bislang wurde die Konsistenz und Zuverlässigkeit dieser Datenquellen in der Regel als gegeben vorausgesetzt. Dies ist jedoch nicht der Fall. In dieser Dissertation schließen wir diese Lücke, indem wir die zeitliche Konsistenz (werden Routen zum richtigen Zeitpunkt aufgezeichnet?) und die interne Konsistenz (werden Routen korrekt aufgezeichnet?) untersuchen. 

Darüber hinaus bewerten wir, ob ein beliebter BGP Routensammler Datenbrokerdienst (BGPStream's Broker) alle Dateien zuverlässig gemäß den angegebenen Suchbefehle zurückgibt. Als Richtlinien basiertes Protokoll wird BGP auf den Border-Routern von ASes eingesetzt. Ein Border-Router unterhält mehrere BGP-Sitzungen und wählt die beste Route für einen IP-Präfix aus, indem er alle erlernten Routen bewertet. Dies geschieht über BGP-Attribute. Durch Anpassen dieser BGP-Attribute und/oder Filtern von Routen kann ein Autonome System (AS) seine Routing Richtlinien implementieren und seine Beziehungen zu anderen Netzwerken verwalten. Es wird allgemein angenommen, dass ASes für alle Sitzungen mit demselben Nachbarn Autonome System (AS) dieselben BGP-Richtlinien verwenden und für denselben IP-Präfix dasselbe benachbarte Autonome System (AS) bevorzugen. 

In dieser Dissertation zeigen wir, dass dies oft nicht der Fall ist – wir bezeichnen solche ASes als heterogen. Wir schlagen zwei Inferenzmethoden vor, um 
i) die Anzahl heterogener ASes zu ermitteln, wie sie von den Routensammlern beobachtet werden, und 
ii) ASes zu identifizieren, die explizit vom herkömmlichen BGP-Verhalten abweichen. Routensammler bieten einen öffentlichen Einblick in das Internet – sie zeigen keine privat zugewiesenen BGP-Attribute an. Daher arbeiten ASes miteinander zusammen und betreiben öffentlich zugängliche Looking Glasses (LGs). LGs sind Websites, auf denen andere Betreiber Abfragen zu einer Teilmenge von Routern innerhalb der ASes durchführen können, um Routing-Informationen zu sammeln. In dieser Dissertation sammeln wir einen LG Datensatz, der sich auf die Erfassung von BGP-Attributen aus mehr als 149 LGs in 154 ASes von 931 Routern durch das Scannen von LGs konzentriert. Die Schwierigkeiten liegen dabei in der Uneinheitlichkeit der LGs – die meisten Schnittstellen unterscheiden sich, die Zugänglichkeit der LGs schwankt und die Ausgabeformate sind unterschiedlich. Um dies zu überwinden, haben wir die manuelle Konfiguration mit einem automatisierten Scraping-Prozess kombiniert, gefolgt von einer sorgfältigen Nachbearbeitung und manuellen Überprüfungen.