Fokus Forschung: Angewandte Biologie und KI sind siegreich

Fokus Forschung: Angewandte Biologie und KI sind siegreich

Forschung, Nachwuchsforschung, Fördermittel / Wettbewerbe

Wissenschaftspreis der Hochschule Mittweida 2024 geht an Felix Erichson

Männliche Person steht mit Preis vor einer Projektorwand
The winner is: Felix Erichson gewinnt den Wissenschaftspreis 2024 der Hochschule Mittweida

Alle Jahre wieder - würdigt die Hochschule Mittweida mit dem Wissenschaftspreis herausragende Forschungsleistungen ihrer Angehörigen. Alle Jahre wieder bewerben sich junge und junggebliebene Forschende um diese Auszeichnung. Nach einer schriftlichen Bewerbung, die durch eine Jury, bestehend aus Professorinnen und Professoren der fünf Fakultäten, bewertet wird, heißt es für die Besten, das Publikum durch einen Pitch zu überzeugen.

In diesem Jahr traten zum Tag der Forschung am vergangenen Mittwoch fünf Bewerberinnen und Bewerber an und stellten in jeweils genau fünf Minuten ihr Thema dem Publikum vor. Es traten an (Reihenfolge der Vorstellung):

Julius Voigt
Biologische Wissensintegration in KI-Modelle für die Analyse von Genexpressionsdaten bei der Karzinom-Klassifikation

Mona Wiebke Urban
Semi-automatisierte Erstellung und Validierung von historischen Ereignis-Datenbanken mithilfe von Prompt Engineering und interaktiver kartographischer Informationsdarstellung

Max Schlosser
Entwicklung eines semi-automatisierten Verfahrens zur Promptgenerierung für die Verbesserung der Lesbarkeit im Kontext der Textgenerierung

Felix Erichson
Entwicklung einer Python-basierten Softwarepipeline für die FRET-gestützte integrative Strukturmodellierung von Ribonukleinsäuren

Julia Köhler
Events als Treiber regionalökonomischer und touristischer Effekte – eine empirische Untersuchung am Beispiel der QUARTERBACK Immobilien ARENA in Leipzig

Nach der Auszählung der Publikumsstimmen konnte der Wissenschaftspreis 2024 vergeben werden. Den 1. Platz und somit den Wissenschaftspreis 2024 erhielt

Felix Erichson

aus den Händen vom Prorektor Forschung, Professor Uwe Mahn.
Platz 2 ging an Julius Voigt. Über Platz 3 konnte sich Max Schlosser freuen.

Die drei Preisträger stellen nachfolgende ihre Themen selbst vor:

Felix Erichson: Wie man aus einem Buchstabensalat ein Biomolekül zum Leben erweckt - oder wissenschaftlich korrekt: Was ist integrative Strukturmodellierung von RNA?

Meine Forschung in der Biophotonik-Gruppe Mittweida beschäftigt sich mit der computergestützten Strukturaufklärung von Ribonukleinsäuren (RNA) und nutzt dabei gleichzeitig experimentelle Daten der Fluoreszenzmikroskopie und -spektroskopie.

RNA spielt eine zentrale Rolle bei der Übersetzung der genetischen Information in Proteine, hat aber neben der reinen Informationsvermittlung als Messenger oder mRNA viele weitere essenzielle Aufgaben wie z.B. katalytische Aktivität (Ribozyme). In der Natur sind Struktur und Funktion von Biomolekülen eng miteinander verknüpft. Um die vielfältigen Funktionen von RNA-Molekülen verstehen zu können, ist es daher hilfreich, ihre Struktur zu kennen. Wir möchten die Struktur eines RNA Moleküls allein anhand seiner Sequenz vorhersagen; dafür nutzen wir nicht nur vorhandene Software wie Rosetta, RNAComposer oder Googles AlphaFold, sondern kombinieren bekannte Strukturmotive in einer Art RNA-LEGO-Prinzip. Mithilfe der Molekulardynamik-Simulationen (MD) simulieren wir die Molekülbewegung und erschaffen so ein recht realistisches und atomgenaues Modell der RNA-Struktur.

Um sicherzustellen, ob das im Computer erschaffene Modell die reale 3D-RNA-Struktur abbildet, nutzen wir experimentelle Daten, um diese Modelle zu validieren. Dabei kommt der Förster-Resonanzenergietransfer, kurz FRET, als molekulares Lineal zum Einsatz. Hierbei werden die RNA Sequenzen mit zwei Fluoreszenzfarbstoffen z.B. grün (Donor) und rot (Akzeptor) markiert und deren Distanz durch eine Verschiebung der Farbintensitäten in Abhängigkeit des Abstandes der Farbstoffe gemessen. Der Vergleich von Experiment (FRET) und Simulation (Computermodell) erlaubt uns die selektive Auswahl des passenden Computermodells oder, anders gesagt: Wir finden die Nadel im Heuhaufen.

Diese Methode wird als integrative Strukturmodellierung bezeichnet und kombiniert Bioinformatik, Biophysik und Molekularbiologie. Neu ist, dass wir viele bereits vorhandene Methoden so zusammenführen, dass sie nahezu vollständig automatisiert auf verschiedenen Betriebssystemen (Win, MacOS, Linux) ablaufen und für die FRET-basierte integrative RNA-Strukturvorhersage optimiert sind.

Das Team der Biophotonik am LHM bietet dafür eine optimale Umgebung, da wir die experimentellen Daten für die Evaluation der Computermodelle am Standort Mittweida selbst erzeugen können, um sowohl die Geschwindigkeit als auch die Qualität der 3D-Strukturvorhersage weiter zu verbessern. Die Gruppe arbeitet interdisziplinär und beleuchtet Fragestellungen der dynamischen RNA-Strukturbiologie aus verschiedenen Perspektiven. Je nach Fragestellung kann die RNA-Struktur dann Ziel eines Medikamentes sein oder die funktionelle RNA Struktur selbst zum Medikament werden. Unsere Methode bietet die Möglichkeit, ein detailliertes Bild des jeweiligen RNA Moleküls zu erstellen und es zukünftig in der computergestützten Medikamentenentwicklung einzusetzen.

Weitere Informationen gibt es auf der Projektwebseite der Forschungsgruppe Biophotonik unter folgendem Link: https://www.inw.hs-mittweida.de/webs/boerner/

Julius Voigt: Datensalat oder wissenschaftlich korrekt: KI-Anwendung bei der Auswertung medizinischer Daten

Ich habe in Mittweida Biotechnologie im Bachelor und Master studiert, jeweils mit der Vertiefung Bioinformatik. Seit 2021 konnte ich in der Forschungsgruppe für Computational Intelligence unter Leitung von Professor Thomas Villmann als wissenschaftlicher Mitarbeiter in verschiedenen Projekten die Methoden der Datenwissenschaften (Data Science) auf biologische Daten anwenden. Man kann in den meisten Fällen Daten nicht einfach nehmen und in irgendwelche Algorithmen stecken, sondern die meist größte Arbeit steckt im Detail: welche Datenvorverarbeitung ermöglicht eine sinnvolle Generierung eines Modells, welches die Daten dann bestmöglich beschreibt. Und dafür muss man immer auch so gut man es eben kann Experte auf dem Gebiet der Daten werden. Da kommt oft mein Wissen aus dem Studium ins Spiel.

Die Fragestellung, welche Gene für eine Krebserkrankung ausschlagebend sind, ist ein hochaktuelles Forschungsthema mit dem sich auch viele andere KI-Wissenschaftler beschäftigen. Dem Thema widmet sich beispielsweise ebenso ein Nature-Paper, welches mit Hilfe eines Deep-Learning-Ansatzes die Integration von zusätzlichem biologischem Wissen zur Modellbildung vorstellt.

Im Gegensatz zu den üblichen tiefen neuronalen Netzen (Deep Learning) bemühen wir einen eher klassischen Algorithmus des Maschinellen Lernens, Learning Vector Quantization (LVQ). LVQ ist intuitiver und im Nachhinein leichter zu interpretieren als tiefe Netze. Wir haben eine Variante von LVQ so angepasst, dass wir biologisches Vorwissen über die Assoziation von Genen untereinander und ihre Mitwirkung in sogenannten Pathways (wie etwa Genregulierungsnetzwerke oder Stoffwechselwege) in die Architektur unseres Modells integrieren konnten. Dadurch wurde die Anzahl der Parameter, die im Trainingsprozess angepasst werden müssen, drastisch verringert. Folglich hat unser Modell die Daten nicht auswendig gelernt (sogenanntes overfitting) und hat im Vergleich eine höhere Diskriminierungsrate (sogenannte accuracy) zwischen metastasierendem und primärem Prostatakrebs.

Neben der Klassikfikation der Daten als eigentliches Ziel wird quasi nebenbei noch an einem Weg der Wissensgenerierung durch das Modell gearbeitet.

Die Maßnahme gegen overfitting war auch nötig, denn die Informationsdichte der Daten ist aufgrund der hohen Dimensionalität (Messung der Genexpression einiger Tausend Gene) und der dafür kleinen Anzahl Patienten sehr gering.

Im Vergleich mit dem Deep-Learning-Ansatz aus dem Nature-Paper, oder aber ohne die Integration von biologischem Wissen, ist unser Modell weniger komplex und braucht demnach auch weniger Rechenschritte im Training und bei der Diagnose und das spart Zeit und Energie.
Link zur Veröffentlichung: https://doi.org/10.5220/0012420700003657

 

Max Schlosser: ChatGPT ist kurz angebunden oder wissenschaftlich korrekt: Reinforcement Learning zur Promptgenerierung

Die Forschungsarbeit knüpft am großen Erfolg von Sprachmodellen wie ChatGPT an. Generierte Texte sind für viele Aufgabenbereiche nützlich, allerdings sind Ausgaben nicht immer leicht lesbar. Das kann für Kinder oder geistig behinderte Menschen ein großer Nachteil beim Verständnis der Texte sein. Die Arbeit erforscht darum, wie Eingaben an das Modell so zusammengesetzt werden können, dass die Lesbarkeit der generierten Texte verbessert wird.

Dafür kommt Reinforcement Learning, eine dynamische Technik des maschinellen Lernens, zum Einsatz. In der Umsetzung dieser Arbeit werden zunächst immer wieder Prompt-Vorlagen ausgewählt, die auf Basis linguistischer Grundlagen erstellt wurden. Die in den Vorlagen eingebauten Lücken füllt das Verfahren mit weiteren Wörtern auf. Statistische Lesbarkeitsmetriken werten anschließend aus, wie gut oder schlecht lesbar der Text ist und trainieren so Schritt für Schritt den Algorithmus, um bessere Prompt-Wort-Kombinationen zu verwenden.

Das final trainierte Modell wurde umfassend analysiert. Am auffälligsten ist die signifikante Verbesserung der Textlesbarkeit, wenn Sprachmodelle in Kombination mit dem trainierten Modell verwendet wurden. Weiterhin wurden linguistische Faktoren, die für die Verbesserung der Lesbarkeit besonders zuträglich sind, herausgestellt. Die Arbeit kann dadurch für weiterführende Forschungen verwendet werden, beispielsweise, um auf dem breiten Gebiet der Lesbarkeit aufzubauen oder um Reinforcement Learning Algorithmen für andere Problemstellungen im Zusammenhang mit Sprachmodellen zu nutzen. Außerdem kann das trainierte Modell direkt mit existierenden Sprachmodellen wie ChatGPT gekoppelt werden, um besser lesbare Texte generieren zu lassen. Dieses Beispiel wurde im Rahmen der Arbeit mit einer Webanwendung implementiert, bei der ich meine im Studium erworbenen Kenntnisse und Fertigkeiten anwenden konnte.

Die vollständige Masterarbeit kann im Monami-Portal der Hochschule unter folgendem Link eingesehen werden: https://monami.hs-mittweida.de/files/15610/MA_Schlosser_Max_52224.pdf

Die Ausschreibung zum Wissenschaftspreis 2025 wird rechtzeitig veröffentlicht.

Text: Felix Erichson, Julius Voigt, Max Schlosser, Annett Kober
Bilder: Helmut Hammer