Bo Segermans forskargrupp

Bioinformatiska metoder och verktyg för analys av variabilitet i stora data-set med mikrobiella helgenomsekvenser

Helgenomsekvensering har blivit en standardanalys inom mikrobiologisk forskning och börjar även användas storskaligt i övervakningsprogram och inom smittspårning. Mycket stora datamängder genereras. En typisk helgenomsekvens kan delas upp i en konserverad ”core-genom”-del och en variabel ”accessory-genom”-del som bara återfinns i vissa isolat. Den totala genuppsättningen brukar kallas för pan-genomet. Ett pan-genom kan användas som referens vid analys av variabilitet i sekvensdata från ett stort antal isolat. Variabilitet finns på flera nivåer (till exempel mutationer i core eller accessory-genomet, variabilitet i genuppsättning, variabilitet i genordning, variabilitet i repetitivitet och variabilitet i mobila genetiska element). En del av variabiliteten i genomdataseten har även tekniska orsaker.

Forskningen är bioinformatiskt inriktad och fokuserar framförallt på metoder för att analysera de stora dataset som genereras i övervakningsprogram för infektiösa mikroorganismer.

Specifika fokusområden:

  • Bioinformatiska metoder att analysera olika typer av variabilitet i stora mikrobiologiska sekvensdataset.
  • Strukturerad lagring av data som beskriver mikrobiologisk genomvariabilitet på olika nivåer.
  • Analys av variabilitet i genomregioner som assemblerar dåligt.
  • Skilja på variabilitet orsakad av tekniska fel och sanna evolutionära händelser.
  • Utforska maskininlärningsmetoder som verktyg för att analysera stora dataset med mikrobiella genomikdata.
  • Implementera metoder/verktyg som kan användas praktiskt inom mikrobiella övervakningsprogram/smittspårnings för att visualisera och tolka variabilitet.