1. Číselná, komplexní a vektorová reprezentace genomických a protetických dat - genomické sekvence jsou uloženy v databázích v symbolické formě - konverzí na genomický signál vzniká možnost využití nástroje zpracování signálů pro analýzu sekvencí - signálová reprezentace nukleotidů vychází z chemické (ne)podobnosti nukleotidů - báze jsou odlišeny podle: - molekulární struktury (puriny R = A a G; pyrimodiny Y = C a T) - síly vazby (slabé W = A a T, dva vodíkové můstky; silné S = C a G, tři vodíkové můstky) - obsahu radikálů (obsahující amino skupinu NH3 M = A a C; nebo keto skupinu C-O K= T a G) - tento klasifikační systém lze graficky vyjádřit nukleotidovým tetrahedronem (nukleotidy jsou mapovány do 4 vektorů symetricky rozložených ve 3D prostoru, vektory jsou orientovány k vrcholům čtyřstěnu) - každá z šesti hran odpovídá jedné ze tříd zahrnující pár nukleotidů, výsledná reprezentace je třírozměrná, osy souřadného systému jsou: • x = W - S • y = M - K • z = R - Y