Forschungsfelder LWS

Das Laboratory for Web Science forscht aktiv auf den Forschungsfeldern Data Science und GeoHealth Analytics. Ergebnisse aus beiden Forschungsfeldern fliessen durch Projekte in die Industrie ein.

Der Begriff Data Science umfasst einen breiten Bereich von Datenauswahl und -verknüpfung über Analytik, technische Realisierung, Unternehmensbezug bis hin zu ethischen Fragen.

Informationen und Wissen sind die Rohstoffe in jedem Unternehmen, die, richtig genutzt, einen entscheidenden Wirtschaftsvorsprung bieten können. Wir unterscheiden strukturierte Daten, die in einer definierten und festgelegten Form gespeichert werden (wie z.B. in Datenbanken und Tabellen), unstrukturierte Daten (Daten, die in allen möglichen Formaten und Plattformen zur Verfügung stehen, wie z.B. E-Mails, Audio und Video Dateien etc.), und semi-strukturierte Daten, wie z.B. HTML und XML. 

Machine Learning

Durch die Entwicklung der Informationstechnologie sind immer grössere Datenmengen verfügbar. Diese enthalten oft implizites Wissen, welches, wenn es bekannt wäre, grosse wirtschaftliche oder wissenschaftliche Bedeutung hätte. Data Mining ist ein Forschungsgebiet, das sich mit der Suche nach potentiell nützlichem Wissen in grossen Datenmengen beschäftigt, und Maschinelles Lernen gehört zu den Schlüsseltechnologien innerhalb dieses Gebiets.

Ziel des Maschinellen Lernens ist die Entwicklung von Methoden zur Realisierung lernfähiger technischer Systeme. Machinelles Lernen lässt sich in zwei grosse Klassen verteilen: Beim überwachten Lernen werden basierend auf vorhandenen Beispieldaten Systeme zur Klassifikation und zur Modellierung funktionaler Abhängigkeiten trainiert. Das Ziel des unüberwachten Lernens ist es, autonom relevante Strukturen in Daten zu finden.

Das LWS bewertet interne sowie externe Daten mit Verfahren des Maschinellen Lernens.

Deep Learning

Deep Learning als Untermenge des Machine Learning eröffnet weitere ungeahnte Möglichkeiten im Umgang mit Daten. Hierbei handelt es sich um Neuronale Netze mit sehr vielen Schichten zwischen der Dateneingabe und -ausgabe. Diese tiefen Netze ermöglichen dadurch das Abbilden von Klassifikationesfunktionen mit hoher Nicht-Linearität, d.h man kann sehr komplexe Aufgaben lösen. Das beste Beispiel dafür sind Convolutional Neural Nets, die im Bereich der Bild- und Signalverarbeitung als disruptive Technologie zu einem enormen Fortschritt geführt haben.

Das LWS hat hier ein grosses Know-How aufgebaut und setzt diese Technologie für Projekte ein.

Recommender Systems

Recommender Systeme lassen sich in drei grosse Klassen einteilen: 

  • Content-Based: Durch Analyse bereits konsumierter Inhalte, Services etc. eines Benutzers, berechnet das System die Wahrscheinlichkeit, dass ein noch nicht konsumiertes Objekt für den entsprechenden Benutzer interessant ist.
  • Collaborative-Filtering: Durch Analyse des Konsumverhaltens aller Beteiligten eines Systems generiert das System durch Projektion eines bipartiten Graphs ein User-User oder Objekt-Objekt Netzwerk. Auf Basis dieses Netzwerkes werden den Benutzern dann Empfehlungen abgegeben.
  • Netzwerk basierend: Im Gegensatz zu Collaborative-Filtering wird der bipartite Graph direkt analysiert. Dies hat den Vorteil, dass keine Informationen durch die Projektion verloren gehen. (siehe: B-Rank: A top N Recommendation Algorithm).
     

Das Anwendungsgebiet von Recommender Systems ist schier unerschöpflich. Von Online-Plattformen bis zu Expertensystemen in der medizinalen Diagnostik. Die Methoden zur Erforschung und Entwicklung solcher Systeme kommen vor allem aus dem Feld “Statistical Learning”.

Das Laboratory for Web Science entwickelt neue Algorithmen und Systemarchitekturen und überprüft deren Anwendbarkeit mittels Projekten in der Industrie. Neben den anwendungsorientierten Entwicklungen werden auch theoretische Modelle entworfen. Diese Modelle sollen ein tieferes Verständnis dafür liefern, welcher Algorithmus bei gegebener Datenbasis geeignet ist.

 

GeoHealth analysiert das Verhältnis zwischen Menschen, Raum, Zeit und Gesundheit. Im wissenschaftlichen Sinne interpretieren wir „GeoHealth Analytics“ als Schnittmenge der Bereiche Geoinformatik, Gesundheitsinformatik und Data Science.

Die wissenschaftlichen Aufgaben reichen in der globalen Betrachtung von epidemiologischen Fragestellungen (räumliches Referenzobjekt: Erde) bis zu lokalen Aufgaben in der Gesundheitsdokumentation (räumliches Referenzobjekt: Mensch). Dabei bedienen wir uns der Werkzeuge des Data Science zur Speicherung (Big Data), Akquisition (Internet of Things) und Analyse (Machine Learning), um Daten in wertvolle Information zu transformieren. Zur Erfüllung der Aufgaben wird auch immer auf die Optimierung von prozessualen und ökonomischen Gesichtspunkten geachtet.

Das Forschungsfeld "GeoHealth Analytics" als Teil des Laboratory for Web Science (LWS) setzt sich in Forschung und Lehre mit Aufgabenstellungen mit Raum- und/oder Gesundheitsbezug auseinander und überprüft die Anwendbarkeit der zugehörigen Lösungen bzw. Prototypen über Drittmittel-Projekte oder Dienstleistungen in Zusammenarbeit mit Industrie und öffentlichen Institutionen. Somit generiert die Forschung des LWS Wissen, das an die Praxis transferiert wird, sofern dies auch einen ökonomischen Nutzen stiftet.