Registrace | Přihlásit

Státnicové otázky: Vypracované státnicové otázky z okruhu Bioinformatika

Skrýt detaily | Oblíbený
Náhledy Náhledy Náhledy
1. Číselná, komplexní a vektorová reprezentace genomických a protetických dat
- genomické sekvence jsou uloženy v databázích v symbolické formě
- konverzí na genomický signál vzniká možnost využití nástroje zpracování signálů pro analýzu sekvencí
- signálová reprezentace nukleotidů vychází z chemické (ne)podobnosti nukleotidů
- báze jsou odlišeny podle:
- molekulární struktury (puriny R = A a G; pyrimodiny Y = C a T)
- síly vazby (slabé W = A a T, dva vodíkové můstky; silné S = C a G, tři vodíkové můstky)
- obsahu radikálů (obsahující amino skupinu NH3 M = A a C; nebo keto skupinu C-O K= T a G)
- tento klasifikační systém lze graficky vyjádřit
nukleotidovým tetrahedronem (nukleotidy jsou mapovány do 4 vektorů symetricky rozložených ve 3D prostoru, vektory jsou orientovány k vrcholům čtyřstěnu)
- každá z šesti hran odpovídá jedné ze tříd zahrnující pár nukleotidů, výsledná reprezentace je třírozměrná, osy souřadného systému jsou:
• x = W - S
• y = M - K
• z = R - Y
Hodnocení (0x):