Seqüència de nucleòtids

De Viquipèdia
Dreceres ràpides: navegació, cerca
Cromatograma d'una seqüenciació automatitzada mostrant part d'una seqüència d'ADN

Una seqüència de nucleòtids o seqüència genètica és una successió de lletres representen part de l'estructura primària d'una molècula real o hipotètica d'àcid nucleic (ADN o ARN). Les possibles lletres són A, C, G, T i U que simbolitzen les cinc subunitats de nucleòtids (adenina, citosina, guanina, timina i uracil), que són bases covalentment lligades a cadenes de fòsfor. En el típic cas, les seqüències es presenten enganxades unes a les altres, sense espais, com en la seqüència AAAGTCTGAC, anant de 5' a 3' d'esquerra a dreta.

Una successió de qualsevol nombre de nucleòtids major a quatre és passible de dir-se una seqüència. En relació a la seva funció biològica, que pot dependre del context, una seqüència pot tenir sentit o antisentit, i ser tant codificant o no codificant. Les seqüències d'ADN poden contenir "ADN no codificant."

Les seqüències poden derivar-se de material biològic de descartament a través del procés de seqüenciació d'ADN.

En alguns casos especials, les lletres seguides d'A, T, C, i G es presenten en una seqüència. Aquestes lletres representen ambigüitat. De totes les molècules mostres, hi ha més d'una classe de nucleòtids en aquesta posició. Les regles de la Unió Internacional de Química Pura i Aplicada (IUPAC) són les que segueixen:

A = adenina
C = citosina
G = guanina
T = timina
U = uracil
R = G A (purina)
Y = T C (pirimidina)
K = G T (keto)
M = A C (amino)
S = G C (enllaços forts)
W = A T (enllaços dèbils)
B = G T C (tots i A)
D = G A T (tots i C)
H = A C T (tots i G)
V = G C A (tots i T)
N = A G C T (qualsevol)

Enllaços externs[modifica | modifica el codi]