Am 24. November 2025 verteidigte Xingchang Huang erfolgreich seine Dissertation mit dem Titel „Understanding noise correlations in generative models for graphics content generation and editing“. Xingchang Huang ist seit Juni 2020 Doktorand am Max-Planck-Institut für Informatik und an der Universität des Saarlandes. Betreut wurde die Arbeit von Prof. Dr. Hans-Peter Seidel, wissenschaftlicher Direktor der Abteilung "Computer Graphics" und Dr. Gurprit Singh, Leiter der Forschungsgruppe "Sampling and Rendering". Der Doktorgrad wird von der Universität des Saarlandes verliehen.
Abstract der Arbeit:
Grafische Inhalte sind in unserem Alltag allgegenwärtig, etwa in vielfältigen Medienformen wie Bildern, Videos, Texturen, Punktmustern und 3D-Objekten. Obwohl die Inhalte so verbreitet sind, ist bisher kaum untersucht, wie sich das Konzept der Rauschkorrelation (Noise Correlation) nutzen lässt, damit Nutzer Grafiken über diese verschiedenen Repräsentationen hinweg nach ihren Vorstellungen erzeugen und bearbeiten können.
Diese Dissertation untersucht, wie Rauschkorrelationen den Prozess der Erzeugung und Bearbeitung visueller Inhalte leiten und vereinfachen können. Von Besonderem Interesse sind dabei die Synthese und Bearbeitung von Punktmustern, Bildern und Stereovideos. Die Hauptbeiträge der Arbeit liegen in der Entwicklung neuer Abläufe, die Rauschkorrelationen nutzen, um sowohl die Wiedergabetreue als auch die Steuerbarkeit in den oben genannten Bereichen zu verbessern. Konkret heißt das: (1) eine ganzheitliche Pipeline zur Extraktion von Merkmalen, die ohne Training auskommt und sich an Rauschkorrelationen für die Synthese von Punktmustern orientiert; (2) eine entkoppelte Repräsentation und einen Korrelations-Einbettungsraum für benutzerfreundliche Punktmusterbearbeitung; (3) eine neue Herangehensweise an die Integration von Blue-Noise-Korrelationen in das Training und Sampling von Diffusionsmodellen; und (4) eine vereinheitlichte Pipeline mit rausch- und degradierungsbasierter Daten-Augmentation zum fine-tuning von Diffusionsmodellen, die gleichzeitig die Generation und Restaurierung von Stereovideos ermöglicht.
Unsere Methoden zeigen die Fähigkeit, bestehende State-of-the-Art-Verfahren zu übertreffen, und unterstreichen das bislang ungenutzte Potenzial der Rauschstruktur als leitendes Prinzip der visuellen Synthese. Diese Erkenntnisse eröffnen neue Wege für die steuerbare und hochqualitative Erzeugung und Bearbeitung grafischer Inhalte.
