Bioinformatika

Rólunk

A molekuláris biológia jelenlegi paradigmája a nagy áteresztőképességű módszerek által előállított adatok értelmezése felé tolódik el. Az új adatforrások lehetővé teszik a biológiai rendszerek egészére kiterjedő tulajdonságok molekuláris szempontból történő vizsgálatát. Csoportunk új, általánosított tudásreprezentációs sémákat és vizsgálati módszereket dolgoz ki az élő sejtek nagyon összetett molekuláris rendszereinek, például a génexpresszió szabályozó hálózatának tanulmányozására. Különleges szakértelemmel rendelkezünk a nagyméretű bioinformatikai adatkezelési megközelítések terén, amelyek a rendszerbiológia integráló erejévé váltak azáltal, hogy közös platformot biztosítanak a különböző nagy áteresztőképességű kísérleti technológiák számára. A modern bioinformatikai stratégiák már nem korlátozódnak csupán egy adott kísérlet konkrét kiértékelésére, hanem a nyilvános adatbázisokban rendelkezésre álló hatalmas mennyiségű kísérleti adaton alapuló kiterjedt adatbányászati megközelítésekkel segíthetnek a kapott eredmények tágabb összefüggéseinek feltérképezésében is.

Technikák

Módszerek

Klasszikus bioinformatikai feladatok

A bioinformatika tudományterületének kialakulásakor számos olyan klasszikus bioinformatikai megközelítés, valamint adatelemzési technika alakult ki, melyek máig a bioinformatika gerincét alkotják, lehetővé téve a kutatók számára, hogy a nyers biológiai adatokból értékes felismeréseket nyerjenek. A klasszikus bioinformatikai vizsgálatok általában egy vagy legfeljebb néhány, a vizsgálat közvetlen fókuszában levő biológiai objektumra (pl. gén, transzkript, fehérje) összpontosítanak.. A klasszikus bioinformatikai feladatok tipikus példái közé tartozik a szekvenciaillesztés, az evolúciós konzerváltság vizsgálata, a filogenetikai elemzések, a strukturális bioinformatikai vizsgálatok, a szekvenciamotívum-keresés, az adatbázis-keresés, stb.

Új generációs bioinformatikai feladatok

Az elmúlt két évtizedben a kísérleti molekuláris biológiai technológiák úgy fejlődtek, hogy lehetővé tették több ezer biológiai objektum egyidejű vizsgálatát egyetlen kísérletben. Ezen úgynevezett nagy áteresztőképességű, holisztikus módszerek eredményeinek kiértékelése teljesen új bioinformatikai megközelítések kifejlesztését tette szükségessé. A feladatok új generációja felé történő elmozdulás nagy adatmennyiségek kezelésére képes, skálázható adatkiértékelési munkafolyamatok létrehozásához vezetett, amelyek telepítése, működtetése és fejlesztése speciális felkészültséget igényel. Az új generációs bioinformatika számos alapvető koncepciót foglal magában, amelyek elengedhetetlenek a nagyléptékű kísérleti technológiák által generált hatalmas mennyiségű adat elemzéséhez és értelmezéséhez. A nagy áteresztőképességű bioinformatikai vizsgálati megközelítések leggyakrabban olyan szervezett munkafolyamatok, amelyek a hatalmas kísérleti adathalmazok szigorú minőség-ellenőrzésével kezdődnek, majd egymást követő adatfeldolgozási lépések összetett sorozatán haladnak keresztül, és gyakran az adatok értékeléséhez szükséges, publikációs minőségű vizualizációk létrehozásával végződnek. A különböző omikai rétegekből (genomika, transzkriptomika, proteomika) származó adatok integrálása szintén kulcsfontosságú feladat ezen a területen, amely elengedhetetlen a komplex biológiai rendszerek átfogó megértéséhez. A nagy áteresztőképességű kísérleti adatok pontos értékelésére, a szignifikancia szintek és az adatok varianciájának kezelésére ezek a munkafolyamatok fejlett statisztikai kiértékelési módszereket tartalmaznak. A vizsgált összetett adathalmazok tulajdonságainak intuitív bemutatásához elengedhetetlenek a hatékony vizualizációs eszközök. A különböző omikai adattípusok (pl. RNA-seq, ChIP-seq) elemzési folyamatának automatizálása szintén jelentős hatással lehet az adatfeldolgozás hatékonyságára.

Egyedi bioinformatikai feladatok

Bizonyos kutatási projektek esetében a kutatóknak egyedi szoftvermegoldásokra van szükségük, hogy olyan speciális analitikai igényeket elégítsenek ki, amelyeket a meglévő eszközök nem tudnak megfelelően kezelni. Ehhez mind a szóban forgó biológiai kérdések, mind a rendelkezésre álló számítási technikák alapos ismerete szükséges. Az egyedi eszközök fejlesztése úgy történik, hogy igazodjanak az adott kutatási projekt speciális követelményeihez, lehetővé téve az egyedi kutatási céloknak megfelelő elemzéseket. Ezek az eszközök önálló alkalmazásokként is működhetnek, azonban manapság a nagy áteresztőképességű bioinformatika területén a nagyobb igény jelentkezik olyan összetett munkafolyamatok létrehozására, amelyek különböző eszközöket és módszereket kapcsolnak össze, és több forrásból származó különböző adathalmazok integrációját foglalják magukban.

Cikkeink

Válogatott publikációk

  • Faragó Anna; Zvara Ágnes; Tiszlavicz László; Hunyadi-Gulyás Éva; Darula Zsuzsanna; Hegedűs Zoltán; Szabó Enikő; Surguta Sára Eszter; Tóvári József; Puskás László G et al.
    Lectin-Based Immunophenotyping and Whole Proteomic Profiling of CT-26 Colon Carcinoma Murine Model
    INTERNATIONAL JOURNAL OF MOLECULAR SCIENCES 25 : 7 Paper: 4022 , 21 p. (2024)
  • Huszár Krisztina; Welker Zsombor; Györgypál Zoltán; Tóth Eszter; Ligeti Zoltán; Kulcsár Péter István; Dancsó János; Tálas András; Krausz Sarah Laura; Varga Éva et al.
    Position-dependent sequence motif preferences of SpCas9 are largely determined by scaffold-complementary spacer motifs
    NUCLEIC ACIDS RESEARCH 51 : 11 pp. 5847-5863. , 17 p. (2023)
  • Boros Éva; Hegedűs Zoltán; Kellermayer Zoltán; Balogh Péter; Nagy István
    Global alteration of colonic microRNAome landscape associated with inflammatory bowel disease
    FRONTIERS IN IMMUNOLOGY 13 Paper: 991346 , 14 p. (2022)
  • Pap Gergely; Ádám Krisztián; Gyorgypal Zoltan; Toth Laszlo; Hegedus Zoltan
    Depthwise Convolutions using Physicochemical Features of DNA for Transcription Factor Binding Site Classification: Physicochemical Features for DNA-Protein Classification with Depthwise Convolutions
    In: Anon, A (eds.) ICAAI '22: Proceedings of the 6th International Conference on Advances in Artificial Intelligence
    New York City, United States of America : ACM (2022) 164 p. pp. 15-21. , 7 p.
  • Sepp Róbert; Hategan Lidia; Csányi Beáta; Borbás János; Tringer Annamária; Pálinkás Eszter Dalma; Nagy Viktória; Takács Hedvig; Latinovics Dóra; Nyolczas Noémi; Attila Pálinkás; Réka Faludi; Miklós Rábai; Gábor Tamás Szabó; Dániel Czuriga; László Balogh; Róbert Halmosi; Attila Borbély; Tamás Habon; Zoltán Hegedűs; István Nagy
    The Genetic Architecture of Hypertrophic Cardiomyopathy in Hungary: Analysis of 242 Patients with a Panel of 98 Genes
    DIAGNOSTICS 12 : 5 Paper: 1132 , 12 p. (2022)
  • Pap Gergely; Adam Krisztian; Gyorgypal Zoltan; Toth Laszlo; Hegedus Zoltan
    Training models employing physico-chemical properties of DNA for protein binding site detection
    In: Colomo-Palacios, Ricardo; Nawaz, Ripon Kazi Shah (eds.) 2021 International Conference on Applied Artificial Intelligence (ICAPAI) Halden, Norway : IEEE (2021) pp. 73-77. Paper: 9462057 , 5 p.
  • Pap Gergely; Györgypál Zoltán; Ádám Krisztián; Tóth László; Hegedűs Zoltán
    Transcription factor binding site detection using convolutional neural networks with a functional group-based data representation
    JOURNAL OF PHYSICS-CONFERENCE SERIES 1824 : 1 Paper: 012001 , 6 p. (2021)
  • Tálas András; Huszár Krisztina; Kulcsár Péter István; Varga Julia K; Varga Éva; Tóth Eszter; Welker Zsombor; Erdős Gergely; Pach Péter Ferenc; Welker Ágnes Zoltán Györgypál ; Gábor E Tusnády; Ervin Welker
    A method for characterizing Cas9 variants via a one-million target sequence library of self-targeting sgRNAs
    NUCLEIC ACIDS RESEARCH 49 : 6 Paper: e31 , 12 p. (2021)
  • Adam, Krisztian; Gyorgypal, Zoltan; Hegedus, Zoltan
    DNA Readout Viewer (DRV) : visualisation of specificity determining patterns of protein binding DNA segments
    BIOINFORMATICS 36 : 7 pp. 2286-2287. , 2 p. (2020)

Munkatársak

HEGEDŰS Zoltán

csoportvezető, tudományos főmunkatárs

GYÖRGYPÁL Zoltán

tudományos munkatárs