Data Science ist ein breit gefächerter Begriff, der zurzeit in aller Munde ist. Was Data Science für den Mathematiker Michael Sedlmayer bedeutet & warum er sich momentan mit altertümlichen Manuskripten beschäftigt, erzählt er am Uni Wien Blog.
Vom Mathematiker zum (zukünftigen) Data Scientist
Schon seit meiner Schulzeit ist für mich die Allgemeingültigkeit der Mathematik äußerst faszinierend. Das hat mich schlussendlich zur Wahl des Studiums Mathematik an der Uni Wien bewogen. Gegen Ende des Studiums merkte ich allerdings, dass mich ausschließlich abstrakte Ergebnisse nicht auf Dauer zufrieden stellen. Daher spezialisierte ich mich im Masterstudium im Bereich „Applied Mathematics and Scientific Computing“. In dieser Spezialisierung geht es darum, bereits bekannte theoretische Konzepte an allgemeine Anwendungsszenarien anzupassen bzw. neue Methoden zu entwickeln, mithilfe derer Probleme auch in Realität effizient gelöst werden können.
Dieser persönliche Drang mündete schlussendlich in einer Masterarbeit in Zusammenarbeit mit einem Energieversorgungs-Unternehmen. Im Zuge dessen musste ich eine größere Menge an Daten importieren und aufbereiten, im Anschluss analysieren, mathematisch verarbeiten und abschließend die Ergebnisse visuell darstellen. Das Projekt war für mich eine sehr positive Erfahrung, insbesondere der Gedanke, mithilfe von mathematischen Konzepten eine Verbesserung in realen Anwendungen herbeizuführen. Dieses Erlebnis war dann meine sprichwörtliche Rutsche in das Gebiet „Data Science“. In dieser Phase verstärkte sich der Wunsch, meine Ausbildung in Form eines Doktorats fortzusetzen und mich zu spezialisieren. Zeitgleich schrieb die Forschungsplattform Data Science @ Uni Vienna Doktoratsstellen für fünf äußerst interessante Anwendungsgebiete aus. Seit letztem Semester arbeite ich daher am Thema „Digital Humanities“.
Forschungsplattform Data Science @ Uni Vienna
Die Forschungsplattform Data Science besteht seit Mai 2018. Sie ist damit noch recht jung und bietet in diesem Bereich das erste Doktoratsprogramm an der Uni Wien an. Besonders an unserer Forschungsplattform ist, dass jede/r DoktorandIn ein eigenes Anwendungsgebiet bearbeitet und von zwei ProfessorInnen betreut wird. Jeweils eine ProfessorIn aus Anwendung (Medizin, Astronomie, Digital Humanities, Industrie 4.0 oder Finanzwirtschaft) und Theorie (Mathematik, Informatik oder Statistik) sorgen für eine ausgewogene Betreuung „von beiden Seiten“. In meinem Fall kümmern sich sowohl eine Professorin für Digital Humanities vom Institut für Geschichte als auch ein Professor für nicht-glatte Optimierung von der Fakultät für Mathematik um mich.
Data Science ist ein Zusammenspiel verschiedenster Wissenschaften
Das Feld der „Digital Humanities“ umfasst die Anwendung computergestützter Verfahren und die systematische Verwendung mathematischer Konzepte und sonstiger digitaler Ressourcen in den Geistes- und Kulturwissenschaften. In meinem Fall betrifft das die Bearbeitung historischer Daten, wie z.B. altertümlicher Manuskripte. Bei den Digital Humanities treffen GeisteswissenschaftlerInnen, wie z.B. HistorikerInnen oder ArchäologInnen auf NaturwissenschaftlerInnen, wie z.B. MathematikerInnen, InformatikerInnen oder StatistikerInnen. Das kann anfänglich durchaus einige Schwierigkeiten in der Kommunikation untereinander mit sich bringen. Dabei geht es um eine Vielzahl an grundverschiedenen Fachbegriffen, Begriffe die ähnlich klingen, aber anders besetzt sind oder nicht klar definierte Termini, die Raum für Fehlinterpretationen lassen. Auch legen die diversen Professionen auf unterschiedliche Aspekte mehr oder weniger Augenmerk. Es macht mitunter sogar den Anschein, als würden wir – obwohl unsere gemeinsame Arbeitssprache Englisch ist – in verschiedenen „Sprachen“ miteinander sprechen.
Neue Sprachen zu lernen lohnt sich
Das unterschiedliche Sprachverständnis mag am Anfang Missverständnisse mit sich bringen. Wenn man sich allerdings nicht davon abbringen lässt und eine neue Sprache lernt, kann man schlussendlich sehr davon profitieren – sowohl im oben beschriebenen akademischen Fall als auch bei einer tatsächlichen Sprache. Mit einer neuen Sprache kann man schlussendlich auch zunehmend einfacher mit fach-„fremden“ WissenschaftlerInnen kommunizieren, um deren Problemstellungen zu verstehen. Beispielsweise erkenne ich mehr und mehr, wie in den Digital Humanities gearbeitet wird und wie sich Forschung in diesem Feld zusammensetzt. Ein weiterer Vorteil ist zu sehen, wie und wo mathematische Modelle in anderen Bereichen genutzt werden können. Nicht zuletzt werden dadurch allgemeine mathematischen Konzepte mit realen Begebenheiten in Bezug gesetzt.
Data Science als Möglichkeit mit Verantwortung
Data Science ist mittlerweile schon seit einiger Zeit sehr aktuell und das wird meiner Meinung nach noch viele weitere Jahre so bleiben. In der heutigen Zeit werden immense Mengen an Daten jederzeit und allerorts produziert. Dadurch entsteht die Chance, die vorhandenen Informationen zu verwerten, um positive Effekte hervorzurufen. Das kann beispielsweise im akademischen Bereich sein, indem neue Forschungserkenntnisse gewonnen werden, aber auch gesamtgesellschaftlich – etwa durch verbesserte Diagnosemöglichkeiten in der Medizin. Werden allerdings massenhaft (persönliche) Daten verarbeitet, darf die ethische und moralische Verantwortung nicht außer Acht gelassen werden.
Meiner Meinung nach bietet die Forschungsplattform Data Science alle Voraussetzungen, sowohl neuartige mathematische Konzepte für Data Science zu entwickeln als auch die gegebenen spezifischen Anwendungsprobleme erfolgreich zu bearbeiten. Ich bin gespannt, was die nächsten drei Jahre für mich und unsere Plattform bringen werden.
Dieser Blogbeitrag ist wie eine Mischung aus Abenteuerroman und Wissenschaftsthriller – man kann förmlich die Hitze der Lava spüren und den Schwefelgeruch in der Luft riechen! Was mich besonders fasziniert: Wie habt ihr es geschafft, trotz des stürmischen Wetters und der unvorhersehbaren Naturkräfte, so viel wissenschaftliche Präzision und Akribie in eure Beobachtungen zu legen? Welche Herausforderung war für dich persönlich die größte auf dieser Reise?
Zu meiner Zeit hat es soetwas leider noch nicht gegeben. Super, dass das noch dazu auch noch überparteilich ist. Klimaschutz ist die wichtigste Überlebensfrage unserer Zeit. Ewiges Wachstum gibt es nicht. irgendwann ist es vorbei. Der Kapitalismus wird fossil dominiert bleiben. So kann es nicht weiter gehn.