Institute for Computer Science I
Prof. Dr. Christian Sohler
                      

General
Home
Contact
People

Research
Projects

Teaching
Winter 08/09
Summer 08
Topics for Diploma Thesis

Links
Bonn Research Platform on Algorithmics
Institute of Computer Science
International MSc Program
Themenvorschläge für Diplomarbeiten:
Um aktuelle Themenvorschläge für Diplomarbeiten zu erhalten, wenden Sie sich bitte an Christian Sohler oder eine/n seiner Mitarbeiter/Innen. Unten aufgeführt sind einige Themenvorschläge, die aber nur sporadisch aktualisiert werden. Sie dienen jedoch dazu, sich ein Bild über mögliche Diplomarbeitsthemen zu machen.

Falls Sie bereits eigene Vorschläge und/oder Vorstellungen zu Diplomarbeitsthemen haben, so können Sie sich ebenfalls gerne an uns wenden.
Berechnung optimaler Kernmengen
Sei P eine Punktmenge im euklidischen Raum. Aufgabe beim k-Median Clustering Problem ist das Finden einer Menge von k Punkten, so dass die Summe der Distanzen zum jeweils nächstgelegenen dieser k Punkte minimiert wird. Wir  
Eine Kernmenge ist eine kleine gewichtete Untermenge einer Punktmenge P, die die Punktmenge bzgl. eines Clusteringproblems approximiert. Aufgabe ist, einen Algorithmus zur Berechnung einer kleinsten Kernmenge einer gegebenen Punktmenge für ein vorgegebenen Fehlerparameter e zu finden.
Clustering von Textdokumenten mit Hilfe von Kernmengen

Die Strukturierung großer Mengen von Textdokumenten (z.B. Webseiten) dient zur Unterstützung der gezielten Suche nach Dokumenten. Häufig wird eine solche Strukturierung mit Hilfe von Clustering Algorithmen berechnet, die die Eingabemenge in Gruppen ähnlicher Dokumente aufteilen. Bei sehr großen Eingabemengen sind die meisten Clusteringalgorithmen nicht sonderlich effizient. Ziel dieser Diplomarbeit ist daher die Entwicklung eines effizienten Algorithmus zum Clustering von Textdokumenten. Dabei sollen in der theoretischen Informatik entwickelte Techniken wie Kernmengen und der k-Means++ Algorithmus auf die neue Problemstellung angepasst und zur Effizienzsteigerung verwendet werden. Die entwickelten Algorithmen sollen experimentell evaluiert werden.