|
|||||||||||
Auf uns rollt eine große Datenflut zu, die wir trotz immer leistungsfähigerer Hardware nicht bewältigen können. Beispiele für diese Datenflut findet man im wissenschaftlichen Bereich (z.B. astronomische Landkarten, Teilchenbeschleuniger, menschliches Genom), im World Wide Web (z.B. der Google Index) oder auch bei der zunehmenden Computerisierung unseres Alltags (z.B. Digital Home). Gleichzeitig werden die Anforderungen an die Datenverarbeitung immer höher und es müssen immer komplexere Aufgaben effizient durchgeführt werden.
Dieses Seminar untersucht moderne Algorithmen und Datenstrukturen, die auf sehr großen Datenmengen mit ggf. sehr vielen weiträumig verteilten Rechnern sehr komplexe Aufgaben ausführen. Es werden Optimierungstechniken, neue verteilte Indexstrukturen, statistische Verfahren und Suchtechniken fürs WWW untersucht.
In diesem Semester (Sommer 2007) liegt der Schwerpunkt bei Verfahren des Information Retrieval.
| Speaker | Topic | Buddy | Date | Betreuer |
| Remo Frey | Text Categorization: Support Vector Machines | Christian Tarnutzer |
12.5. |
Kossmann |
| David Degen | Web Result Ranking: PageRank | Michael Stämpfli | 12.5. | Kossmann |
| Christian Klar | Web Result Ranking: Machine Learning | Julia Imhof | 12.5. | Kossmann |
| Marko Ristin | Web Result Ranking: Linguistic Models | Simon Loesing | 12.5. | Widmayer |
| Christoph Zimmerli | Clickstream Analysis: Clickthroughs | Corinne Müller | 12.5. | Hofmann |
| Patrick Lau | Abusing Web Search | Remo Frey | 12.5. | Hofmann |
| Sandro Bünter | Trust Propagation | David Degen | 9.6. | Widmayer |
| Christian Tarnutzer | Web Spam | Christian Klar | 9.6. | Widmayer |
| Julia Imhof | Personalization: Behavior | Christoph Zimmerli | 9.6. | Widmayer |
| Corinne Müller | Semantic Retrieval | Patrick Lau | 9.6. | Hofmann |
Individual for each topic. Pointers for each topic will be given at the beginning.
All reports must be written in English. All talks must be in English.
Each participant writes a self-contained report of about 10 pages. Furthermore, each participant gives a talk of about 30-45 minutes. Each participant is associated to another participant who serves as a buddy for the report and talk. Buddies read the report, make suggestions for improvements, and consult on the talk (e.g., slides).
The credit points of this seminar can be used by Master students as "focus" for the specialization tracks on Information Systems and Theoretical Computer Science. Furthermore, the credit points can be used for the "elective courses".
The seminar can also be taken by (advanced) Bachelor students.
All talks will be given on May 12 and June 8. Reports are due on April 28 and May 25, respectively. (Reports are due to weeks before the talk.)
Thomas Hofmann (Google),
Donald Kossmann und Peter Widmayer
Wichtiger Hinweis:
Diese Website wird in älteren Versionen von Netscape ohne
graphische Elemente dargestellt. Die Funktionalität der
Website ist aber trotzdem gewährleistet. Wenn Sie diese
Website regelmässig benutzen, empfehlen wir Ihnen, auf
Ihrem Computer einen aktuellen Browser zu installieren. Weitere
Informationen finden Sie auf
folgender
Seite.
Important Note:
The content in this site is accessible to any browser or
Internet device, however, some graphics will display correctly
only in the newer versions of Netscape. To get the most out of
our site we suggest you upgrade to a newer browser.
More
information