
The Max-Planck Society (MPG) is the premier basic research organization in Germany. The Max-Planck Institut für Informatik conducts research in Computer Science and Information Technology.
Within the Machine Learning Group, research fellowships and positions are offered for prospective PhD students and postdocs. The research of the group focuses on statistical machine learning and applications in information retrieval and natural language processing.
Currently, especially applicants are sought for a cooperation with an industrial partner that addresses scalable algorithms for personalized ranking of online advertisements. For prospective PhD students, a degree (German Diplom or Master's Degree) is required in Computer Science (Informatik), as well as a background in machine learning. A background in information retrieval and natural language processing is appreciated, but not required. Applicants seeking a postdoc position should have a record of strong publications at top-level conferences or journals (e.g., ICML, NIPS, SIGIR, KDD).
Applications should include the usual information such as curriculum vitae, copies of graduation documents, and a list of publications. Women are encouraged to apply. The Max-Planck Society is an equal opportunity employer. Qualifications being equal, precedence will be given to candidates whit disabilities. Applications should be sent by email, as a single PDF file, to Tobias Scheffer.
Learning to predict protein interactions based on multiple aspects of their similarity; advisors: Ulf Brefeld, Ingolf Sommer.
Gaussian regression for tertiary structure prediction; advisors: Ulf Brefeld, Ingolf Sommer.
Learning to localize bugs based on traces of failing tests; advisors: Valentin Dallmeier, Christian Lindig, Tobias Scheffer.
Scalable Ranking of Online Ads; advisor: Peter Haider.
Netflix, personalized recommendation of movies; advisor: Peter Haider.
Search Engine Spamming; advisor: Isabel Drost.
Unter Suchmaschinen-Spamming versteht man alle Handlungen, die dazu führen, dass eine Internet-Suchmaschine auf eine Stichworteingabe hin auf den vordersten Plätzen Webseiten ausgibt, die keine für den Benutzer relevanten oder dem Suchbegriff entsprechenden Informationen enthalten. Inhalt dieser Studienarbeit ist das Vorstellen möglichst vieler verschiedener Ansätze eine Suchmaschine zu "spammen". Am Beispiel von Google sollen diese Verfahren evaluiert und hinsichtlich ihres Erfolgs verglichen werden.
Wikipedia Bots; advisor: Steffe Bickel.
Acronym generation and expansion; advisor: Steffen Bickel.
Akronyme sind Abkürzungen, die man als Wort auspricht. Wenn das resultierende Wort dann noch eine Bedeutung hat, dann klingt das Akronym noch besser. Beispiele:
EA = Tiny Encryption Algorithm,
CONCERT = Communications for North Carolina Education, Research and Technology,
PEEP = Program for Educating Exceptional Preschoolers.
Ein m&ooml;gliches Ziel einer Arbeit ist es, einen Algorithmus zu entwickeln, der als Eingabe die ausgeschriebene Fassung eines Akronyms erhält
und dann ein Akronym ausgibt, das sowohl ein gültiges Wort ist und zusätzlich noch eine positive Bedeutung hat.
Eine zusätzliche Herausforderung ist die Beurteilung der positiven Bedeutung des Akronyms.
Ein weiteres Thema besteht in der Entwicklung eines Algorithmus, der zu einem Akronym und einem vorgegebenen Themenumfeld eine mögliche Expansion generiert.
Pulp Fiction Generator; advisor: Steffen Bickel.
Ziel der Arbeit ist es, ein Groschenroman-Modell zu lernen, mit dessen Hilfe das Verfassen von Groschenromanen erleichtert wird. Als Trainingsdaten werden existierende Groschenromane verwendet. Hat ein Autor eine Schreibblockade, kann er verschiedene Stichworte vorgeben, aus denen mit dem Modell Sätze oder ganze Absätze in natürlicher Sprache generiert werden.
Generation of Lombardi paintings; advisor: Ulf Brefeld.
Der New Yorker Künstler Mark Lombardi zeichnete soziale Graphen, in denen kriminelle und anrüchige Verstrickungen von Personen und Organisationen dargestellt sind. Knoten seiner Graphen sind Personen und Organisationen, Kanten sind Beziehungen (gemeinsame Erwähnungen in Presseartikeln). Ziel dieser Arbeit ist die Entwicklung eines Systems, das Pfade zwischen Personen berechnet und so Lombardi-Gemälde generieren kann. Um eine direkte Kante zwischen zwei Personen zu entdecken, müssen die beiden Personen in einem Text erwähnt gefunden werden. Die Art der Kante kann durch eine Klassifikation der gemeinsamen Erwähnung bestimmt werden. Damit auch Pfade zwischen Knoten gefunden werden können, muss zusätzlich ein Suchalgorithmus verwendet werden.
Find-an-Expert; advisor: Laura Dietz.
Ziel dieser Arbeit ist die Entwicklung einer Suchmaschine, die zu einem Themengebiet (Suchanfrage) die kompetentesten Personen findet (Suchergebnis). Dies soll auf Grundlage von Veröffentlichungen geschehen. Zwei wichtige Komponenten dazu sind eine Funktion die die Relevanz der Veröffentlichungen einer Person zum angefragten Themengebiet quantifiziert sowie eine Variante des Page-Rank. Der Page-Rank eine Person muss auf der Basis der Verweise im Zitierungsgraphen berechnet werden.