Reservoir computing voor automatische genherkenning in bioinformatica

Probleemstelling

Een belangrijke stap in het ontrafelen van de werking van levende organismen is de identificatie van genen in het DNA, en de bepaling van hun correcte structuur. Gezien de enorme hoeveelheden data die hiervoor verwerkt dienen te worden nemen onderzoekers hun toevlucht tot methoden die op automatische wijze de belangrijkste structuurelementen op het DNA kunnen voorspellen.

Technieken uit het gebied van machine-leren bouwen op een automatische wijze een model voor zulke structuurelementen, en kunnen nadien gebruikt worden om op grote schaal nieuwe genen te ontdekken in het DNA.

Reservoir Computing (RC) is een nieuwe methode binnen het gebied van Machine Learning. De techniek combineert de krachtige temporele verwerkingsmogelijkheden van teruggekoppelde neurale netwerken met de gemakkelijke trainbaarheid van eenvoudige lineaire regressiemethoden. Deze twee eigenschappen, in combinatie met een g oede tot zeer competitieve prestatie op een reeks lastige temporele problemen in de robotica, spraakverwerking, medische signaalverwerking,... maken van RC een veelbelovende methode.

Het concept achter RC is om een teruggekoppeld neuraal netwerk op een min of meer willekeurige manier aan te maken (het reservoir), en dit te exciteren met een invoersignaal. Vervolgens wordt enkel een lineaire classificatie- of regressiemethode getraind op basis van de dynamische toestanden van het reservoir. Binnen de vakgroep is een Matlab toolbox ontwikkeld die toelaat om gemakkelijk grootschalige experimenten op te zetten met RC.

Doelstelling

In het verleden werd Reservoir Computing reeds succesvol toegepast op klassieke temporele patroonherkenningsproblemen zoals spraakherkenning. In deze thesis zal de student nagaan in hoeverre deze technieken ook kunnen toegepast worden op het domein van DNA sequenties, waarbij de notie van tijd equivalent gesteld kan worden met die van een positie in de DNA sequentie. Belangrijke aspecten hierbij zijn de mogelijke encoderingen van de DNA sequentie, en de evaluatie van de prestatie van Reservoir Computing in vergelijking met traditionele technieken.

Contactpersonen










Contact:
VIB / UGent
Bioinformatics & Evolutionary Genomics
Technologiepark 927
B-9052 Gent
BELGIUM
+32 (0) 9 33 13807 (phone)
+32 (0) 9 33 13809 (fax)

Don't hesitate to contact the in case of problems with the website!

You are visiting an outdated page of the BEG/Van de Peer Lab site.

Not all pages have been ported, so these archived pages are still available.

Redirect to the new website?