Forma canònica de Jordan

De Viquipèdia
Dreceres ràpides: navegació, cerca
Un exemple de matriu en forma canònica de Jordan. Els blocs grisos s'anomenen blocs de Jordan i només tenen diferents de zero els valors de la diagonal (els valors propis) i els que queden immediatament per damunt (aquests valen 1). La resta d'elements de la matriu, fora dels blocs de Jordan, són tots zero (aquí representats amb espais en blanc).

La forma canònica de Jordan o forma normal de Jordan[1] és un terme matemàtic utilitzat en àlgebra lineal. Deu el seu nom al matemàtic francès Camille Jordan, que la va descobrir el 1871 per a solucionar sistemes d'equacions diferencials complexes per a matrius complexes. En concret, és la representació d'un endomorfisme amb una matriu de Jordan, que és una forma especial de matriu triangular superior, en certa base.

El problema de trobar la forma canònica de Jordan d'un endomorfisme consisteix en trobar quina és la matriu de Jordan que el representa i quina és la base en què l'endomorfisme pren aquesta forma.[2]

L'aspecte d'una matriu (o d'un endomorfisme, o d'un operador lineal) en forma canònica de Jordan és el d'una matriu amb gairebé totes les entrades nul·les, llevat de la diagonal principal i dels elements immediatament per sobre[3] (o per sota)[4][5] d'aquesta diagonal, que són 1 o 0.

En un espai vectorial complex de dimensió finita, qualsevol endomorfisme té una forma canònica de Jordan.[2] En canvi, en un espai vectorial real, no tots els endomorfismes tenen una forma canònica de Jordan real.[2]

Precedents[modifica | modifica el codi]

Camille Jordan (1838-1922)

Camille Jordan i Leopold Kronecker tingueren una gran controvèrsia durant l'any 1874, generada per l'ambició de Jordan per reorganitzar la teoria de formes bilineals mitjançant el que anomenà noció «simple» de forma canònica.[6][7] Donats dos polinomis bilineals P=\sum_{i,j=1}^n A_{ij}x_i y_j i Q=\sum_{s,t=1}^n B_{st}x_s y_t, hom es planteja la possibilitat de reduir ambdós polinomis P i Q simultàniament a la seva forma canònica.

D'una banda, Karl Weierstrass va definir el 1868 un conjunt complet de polinomis invariants per parells de formes bilineals no-singulars, que es calculen a partir del determinant |P+sQ|, i que designà com divisors elementals de (P,Q). Tota forma quadràtica Q(X)=\sum_{i,j=1}^n x_i a_{ij} x_j sobre \mathbb{R} és equivalent a una única forma y_1^2+y_2^2+\cdots+y_p^2-y_{p+1}^2-\cdots-y_r^2, on r representa el rang de la matriu simètrica A = [aij] i p és la major dimensió de tots els subespais V sobre els quals Q(X) és definida positiva. A més, dues matrius n×n A i B són congruents si i només si tenen el mateix rang i la mateixa signatura.[8]

El càlcul d'invariants era un mètode típic de la teoria de formes bilineals desenvolupada en la dècada de 1860, i es considerava un tema d'estudi especialitzat, limitat a alguns geòmetres de Berlín, com ara Christoffel, Kronecker i Weierstrass. D'altra banda, en l'àmbit de la teoria de grups, Jordan afirmà que una substitució lineal podia reduir-se a una forma canònica simple. Els dos teoremes foren plantejants de manera independent i pertanyien a diferents àrees de les matemàtiques, fins que Jordan afirmà el 1873 que el seu teorema es podria aplicar a la teoria de formes.

El 1766, Lagrange desenvolupà un mètode per la integració d'un sistema de n equacions lineals a coeficients constants que modelitzava les petites oscil·lacions d'una molla carregada amb un nombre arbitrari de pesos (simbolitzat per {\mathrm d}y_i = \sigma_k y_i \,(i=1,\ldots,n), on \sigma_k representen els períodes de les oscil·lacions independents). El punt comú dels invariants de Weierstrass i de la forma canònica de Jordan era que llurs mètodes eren capaços de proporcionar una solució completa a aquest problema, independentment de la multiplicitat de les seves arrels. Jordan també arribà a aquesta conclusió entre 1871 i 1872.[9]

La qüestió va ser llavors quin mètode s'havia d'emprar per organitzar la teoria de formes bilineals. D'una banda, Jordan argumentà que el mètode principal de la teoria havia de ser la reducció algebraica de les formes a les seves formes canòniques més simples. D'altra banda, Kronecker objectà que la teoria pertanyia a l'aritmètica de les formes segons la tradició de Gauss, i que, per tant, el problema principal havia de ser caracteritzar les classes d'equivalència de les formes mitjançant el càlcul d'invariants. És més, Kronecker argumentà que els invariants de Weierstrass es podien calcular de forma efectiva, perquè estaven definits com a màxims comuns divisors dels menors extrets del polinomi invariant |P+sQ|; en canvi, segons el mateix Kronecker, la forma canònica de Jordan no es podia calcular de forma efectiva, en general, i s'havia de considerar com una "noció formal" sense "significat objectiu".

Motivació[modifica | modifica el codi]

Un operador lineal entre espais vectorials de dimensió finita es pot representar amb una matriu; si l'operador lineal és un endomorfisme (o sigui, un operador lineal d'un espai vectorial sobre si mateix), aleshores la matriu és quadrada.

La matriu que representa un endomorfisme depèn de la base que fem servir. En moltes aplicacions dels endomorfismes ens convindrà triar la base de manera que la matriu que representa un cert endomorfisme tingui una forma tan senzilla com sigui possible. La forma més senzilla que pot adoptar la matriu d'un endomorfisme és la d'una matriu diagonal, però sovint no serà possible trobar-ne una (o sigui, no tots els endomorfismes són diagonalitzables). Pels endomorfismes no diagonalitzables, podem intentar representar-los amb una matriu de Jordan, que és una mica menys senzilla que una matriu diagonal, però encara prou manejable.

Per exemple, una matriu A n × n és diagonalitzable si i només si la suma de les dimensions dels seus espais propis és n.[10] De forma equivalent, si i només si An vectors propis linealment independents. No totes les matrius són diagonalitzables. Considerem la següent matriu:

A=\begin{pmatrix}
  5 &  4 &  2 &  1 \\
  0 &  1 & -1 & -1 \\
 -1 & -1 &  3 &  0 \\
  1 &  1 & -1 &  2
\end{pmatrix}.

Si tenim en compte les multiplicitats, els valors propis de A són λ = 1, 2, 4, 4. La dimensió del nucli de (A − 4In) és 1 (i no 2), de tal manera que A no és diagonalitzable. En canvi, existeix una matriu invertible P tal que A = PJP−1, on

J = \begin{pmatrix}
1 & 0 & 0 & 0 \\[2pt]
0 & 2 & 0 & 0 \\[2pt]
0 & 0 & 4 & 1 \\[2pt]
0 & 0 & 0 & 4 \end{pmatrix}.

La matriu J és gairebé diagonal. De fet, és la forma canònica de Jordan de A. A la secció Exemples de càlcul es poden trobar els detalls de com calcular-la.

Qualsevol matriu quadrada té una forma canònica de Jordan si estenem el cos de coeficients a un altre cos que contingui tots els valors propis de la matriu. Malgrat el seu nom, la forma canònica per una matriu M no és completament única, perquè és una matriu diagonal per blocs, on cadascun d'ells és un bloc de Jordan, l'ordre dels quals no està fixat; per convenció, hom agrupa els blocs del mateix valor propi, però no hi ha preestablert cap ordre en els valors propis, ni en els blocs per un mateix valor propi; encara que això últim en pot reduir lleugerament la mida.

Un altre motiu per considerar la forma canònica de Jordan d'una matriu és la simplificació dels càlculs que hom ha de realitzar quan es vol calcular una potència n-sima d'una matriu. Per exemple, donada una matriu A, si volem calcular A^{10}, hem de calcular A^2=A\cdot A, després A^3=A^2\cdot A, i així successivament fins a arribar a A^{10}=A^9\cdot A, un càlcul que pot resultar senzill però farragós (el cost computacional de multiplicar només dues matrius és aproximadament O(n^3), si n és la grandària de les matrius; per tant, el cost computacional de calcular la k-sima potència d'una matriu n×n és aproximadament O(kn^3), en notació de Landau).[11] En canvi, si primer determinem la forma canònica de Jordan de A, diguem-ne J, tindrem que existeix una matriu de canvi de base P tal que A=PJP^{-1}. A partir d'aquí,

\begin{align}
A^{10} &= \overbrace{A \cdot A \cdots A}^\text{10 cops} \\
&= \overbrace{(PJP^{-1})(PJP^{-1})\cdots(PJP^{-1})}^\text{10 cops} \\
&= PJ(\cancel{P^{-1}P})J(\cancel{P^{-1}P})\cdots J(\cancel{P^{-1}P})JP^{-1} \\
&= P\cdot\overbrace{J\cdots J}^\text{10 cops}\cdot P^{-1} \\
&= PJ^{10}P^{-1} \\
\end{align}

on J^{10} és més fàcil de calcular que A^{10}, perquè J és una matriu per blocs, on cada bloc és triangular superior. De fet, per calcular la potència k-sima d'una matriu expressada en forma canònica de Jordan, només cal calcular la potència k-sima de cada bloc de Jordan. És a dir, si tenim una matriu en forma canònica de Jordan

J=\begin{pmatrix}
J_{\lambda_1} &               &        &               \\
              & J_{\lambda_2} &        &               \\
              &               & \ddots &               \\
              &               &        & J_{\lambda_r} \\
\end{pmatrix}

amb r blocs de Jordan J_\lambda, la seva potència k-sima és:

J^k=\begin{pmatrix}
J_{\lambda_1}^k &                 &        &                 \\
                & J_{\lambda_2}^k &        &                 \\
                &                 & \ddots &                 \\
                &                 &        & J_{\lambda_r}^k \\
\end{pmatrix}.

Ara, la potència k-sima d'un bloc de Jordan de dimensió d

J_\lambda = \begin{pmatrix}
\lambda & 1 & 0 & \cdots & 0 \\
0 & \lambda & 1 & \cdots & 0 \\
\vdots & \vdots & \ddots & \vdots & \vdots \\
0 & 0 & \cdots & \lambda & 1 \\
0 & 0 & \cdots & 0 & \lambda \\
\end{pmatrix}

és, de forma explícita:

J_\lambda^k = \begin{pmatrix}
\lambda^k & k\lambda^{k-1} & \binom{k}{2}\lambda^{k-2} & \cdots & \binom{k}{d-1}\lambda^{k-(d-1)} \\
0 & \lambda^k & k\lambda^{k-1} & \cdots & \binom{k}{d-2}\lambda^{k-(d-2)} \\
\vdots & \vdots & \ddots & \vdots & \vdots \\
0 & 0 & \cdots & \lambda^k & k\lambda^{k-1} \\
0 & 0 & \cdots & 0 & \lambda^k \\
\end{pmatrix}

on \binom{k}{h}=\frac{k!}{h!(k-h)!}, i amb la convenció de què \binom{k}{h}=0 per h\geq k.[12]

El cost computacional per calcular la forma canònica de Jordan d'una matriu n×n és aproximadament O(n^3+n^2).[13] A partir d'aquí, per completar el càlcul, hom només ha d'afegir el cost computacional del càlcul de la inversa de P, i dos productes matricials.

Definició[modifica | modifica el codi]

Un exemple de matriu de Jordan. Els blocs grisos s'anomenen blocs de Jordan i només tenen diferents de zero els valors de la diagonal i els que queden immediatament per damunt (aquests valen 1). La resta d'elements de la matriu, fora dels blocs de Jordan, són tots zero (aquí representats amb espais en blanc). En aquest exemple, el polinomi característic és P(λ)=(λ-λ1)3(λ-λ2)2(λ-λ3)…(λ-λn)2; per tant, la multiplicitat del valor propi λ1 és 3, la de λ2 és 2, la de λ3 és 1, i la de λn és 2.

Sigui f\colon E\to E un endomorfisme d'espais vectorials. Suposem que el polinomi mínim de f descompon en factors lineals. Sigui E=F_0\oplus\cdots\oplus F_r la descomposició de E en suma directa d'espais f-cíclics, i sigui (x-a_i)^{s_i} el polinomi mínim de la restricció de f a F_i. Triem per a cada F_i un vector u_i amb polinomi mínim (x-a_i)^{s_i}. Aleshores els vectors

u_i,\quad (f-a_i I)(u_i),\quad\ldots,\quad (f-a_i I)^{s_{i-1}}(u_i)

són linealment independents. Ara, \dim F_i = s_i i per tant aquests vectors formen una base. La matriu de la restricció de f a F_i en aquesta base és

\left. J(a_i,s_i)=\begin{pmatrix}
a_i & 0 & 0& \cdots & 0 & 0 \\
1 & a_i & 0&\cdots & 0 & 0 \\
0 & 1 & a_i&\cdots & 0 & 0 \\
\vdots & \vdots &\ddots& \ddots & \vdots & \vdots \\
0 & 0 & 0&\ddots & a_i & 0 \\
0 & 0 & 0&\cdots & 1 & a_i
\end{pmatrix}\quad\right\}s_i.

Hom diu que J(a_i,s_i) és un bloc de Jordan pel valor propi a_i de dimensió s_i.

Nota: Alguns autors[14] prefereixen escriure
\left. \tilde{J}(a_i,s_i)=\begin{pmatrix}
a_i & 1 & 0 & \cdots & 0 & 0 \\
0 & a_i & 1 & \cdots & 0 & 0 \\
0 & 0 & a_i & \ddots & 0 & 0 \\
\vdots & \vdots & \ddots & \ddots & \ddots & \vdots \\
0 & 0 & 0 & \cdots & a_i & 1 \\
0 & 0 & 0 & \cdots & 0 & a_i
\end{pmatrix}\quad\right\}s_i.
Això no suposa una pèrdua de generalitat, perquè la forma de la matriu depèn de l'ordenació dels vectors de la base en la qual pren aquesta forma.

Tenim així el següent teorema:[15]

Si el polinomi mínim de f\in\mathrm{End}(E) descompon en factors lineals, existeix una base de E en la qual la matriu de f és de la forma

J=\begin{pmatrix}
J(a_0,s_0) & & & 0 \\
& J(a_1,s_1) & & \\
& & \ddots & \\
0 & & & J(a_r,s_r)
\end{pmatrix}.

Forma canònica de Jordan

De la mateixa manera que parlem de la forma de Jordan d'un endomorfisme, també podem parlar de la forma de Jordan d'una matriu. Trobar la forma canònica de Jordan d'una matriu és trobar una matriu de Jordan semblant a aquesta, i trobar també la transformació de semblança. El problema de trobar la forma de Jordan d'una matriu és equivalent al problema de trobar la forma de Jordan d'un endomorfisme representat per aquesta matriu.

Procediment de càlcul[modifica | modifica el codi]

Hem de trobar una base en la qual la matriu prengui la forma J vista anteriorment. Observem que els elements a_i que apareixen a la diagonal de la matriu canònica de Jordan són els valors propis de f (possiblement repetits). Per obtenir una base de E en què la matriu de f sigui la matriu canònica de Jordan, procedirem de la següent forma.

Siguin p(x)=(x-\lambda_1)^{\alpha_1}\cdots(x-\lambda_r)^{\alpha_r} i m(x)=(x-\lambda_1)^{s_1}\cdots(x-\lambda_r)^{s_r} els polinomis característic i mínim de f. Es té que \alpha_1+\cdots+\alpha_r=n=\mathrm{dim}E i s_i\leq \alpha_i\quad\forall i.[16] Els enters s_i estan caracteritzats pel fet que

\begin{align}
\{\vec 0\}& \subset\mathrm{Nuc}(f-\lambda_i I) \\
& \subset\mathrm{Nuc}(f-\lambda_i I)^2 \\
& \subset\cdots\subset \\
& \subset\mathrm{Nuc}(f-\lambda_i I)^{s_i-1} \subsetneqq \mathrm{Nuc}(f-\lambda_i I)^{s_i}
\end{align}

i

\mathrm{Nuc}(f-\lambda_i)^{s_i}=\mathrm{Nuc}(f-\lambda_i)^t=E^i\quad\forall t\geq s_i.

A més,

E=E^1\oplus\cdots\oplus E^r.

La base que busquem és unió de bases convenients dels subespais invariants E_i. Restringint-nos a aquests espais, podem suposar que el polinomi característic de f\in\mathrm{End}(E) és (x-\lambda)^n i el polinomi mínim (x-\lambda)^s, amb s\leq n.[16] Per a qualsevol u\in E designarem (f-\lambda I)(u) per q(u).

Considerem aquest requadre de vectors:

E=\mathrm{Nuc}(f-\lambda I)^s u_{11} \cdots u_{1k_1}
\mathrm{Nuc}(f-\lambda I)^{s-1} q(u_{11}) \cdots q(u_{1k_1}) u_{21} \cdots u_{2k_2}
\cdots \cdots \cdots \cdots \cdots \cdots \cdots
\mathrm{Nuc}(f-\lambda I)^2 q^{s-2}(u_{11}) \cdots q^{s-2}(u_{1k_1}) q^{s-3}(u_{21}) \cdots q^{s-3}(u_{2k_2}) \cdots u_{s-1,1} \cdots u_{s-1,k_{s-1}}
\mathrm{Nuc}(f-\lambda I) q^{s-1}(u_{11}) \cdots q^{s-1}(u_{1k_1}) q^{s-2}(u_{21}) \cdots q^{s-2}(u_{2k_2}) \cdots q(u_{s-1,1}) \cdots q(u_{s-1,k_{s-1}}) u_{s1} \cdots u_{sk_s}

Els vectors u_{11},\ldots,u_{1k_1} determinen classes que formen una base de \mathrm{Nuc}(f-\lambda I)^s / \mathrm{Nuc}(f-\lambda I)^{s-1}. És fàcil veure que u_{11},\ldots,u_{1k_1} són linealment independents i que q(u_{11}),\ldots,q(u_{1k_1})\in\mathrm{Nuc}(f-\lambda I)^{s-1} determinen classes linealment independents a \mathrm{Nuc}(f-\lambda I)^{s-1} / \mathrm{Nuc}(f-\lambda I)^{s-2}. Els vectors u_{21},\ldots,u_{2k_2} són vectors representants de classes que, juntament amb les anteriors, formen una base de \mathrm{Nuc}(f-\lambda I) formada pels vectors situats a l'última fila del requadre.

Tenim aleshores:[16]

  • El conjunt de tots els vectors que apareixen enn el requadre formen una base de E.
  • El nombre de columnes és la multiplicitat del valor propi \lambda.
  • El nombre de files és l'exponent del polinomi mínim.
  • El nombre de vectors a cada fila és \mathrm{dim}(\mathrm{Nuc}(f-\lambda I)^t / \mathrm{Nuc}(f-\lambda I)^{t-1}) = \bar{q}_t - \bar{q}_{t-1} = p_t.
  • El nombre de matrius J(\lambda,t) que apareixen en la matriu canònica de Jordan de f és n_t = p_t - p_{t+1}, que és la diferència de vectors en files consecutives.
  • Cada columna és la base d'un subespai f-cíclic de la descomposició de E.

Matrius complexes[modifica | modifica el codi]

En general, una matriu quadrada a entrades complexes A és semblant a una matriu diagonal per blocs

J = \begin{pmatrix}
J_1 & \;     & \; \\
\;  & \ddots & \; \\ 
\;  & \;     & J_p\end{pmatrix}

on cada bloc Ji és una matriu quadrada de la forma

J_i = 
\begin{pmatrix}
\lambda_i & 1            & \;     & \;  \\
\;        & \lambda_i    & \ddots & \;  \\
\;        & \;           & \ddots & 1   \\
\;        & \;           & \;     & \lambda_i       
\end{pmatrix}.

Així doncs existeix una matriu invertible P tal que P-1AP = J té la propietat que els únics elements no-nuls de J són a la diagonal i a la superdiagonal. J s'anomena forma canònica de Jordan de A. Cada Ji s'anomena bloc de Jordan de A. En cadascun dels blocs de Jordan, totes les entrades de la superdiagonal són iguals a 1.

Assumint aquest resultat, en podem deduir les següents propietats:

  • Tenint en compte les multiplicitats, els valors propis de J, i per tant de A, són les entrades de la diagonal.
  • Donat un valor propi λi, la seva multiplicitat és la dimensió de Ker(A − λi I), i és el nombre de blocs de Jordan corresponents a λi.[17]
  • La suma de les mides de tots els blocs de Jordan corresponents a un valor propi λi és la seva multiplicitat algebraica.[17]
  • A és diagonalitzable si i només si, per cada valor propi λ de A, les seves multiplicitats geomètrica i algebraica coincideixen.[18]
  • El bloc de Jordan corresponent a λ és de la forma λ I + N, on N és una matriu nilpotent definida com a Nij = δi,j−1 (on δ és la delta de Kronecker).[4] El fet de ser N nilpotent és de gran ajut quan es vol calcular f(A) on f és una funció analítica complexa. Per exemple, la forma de Jordan pot donar una formulació tancada i explícita de l'exponencial exp(A).
  • El nombre de blocs de Jordan corresponents a λ de mida almenys j és dim Ker(A - λI)j - Ker(A - λI)j-1. Així, el nombre de blocs de Jordan de mida exactament j és
2 \dim \ker (T - \lambda_i I)^j - \dim \ker (T - \lambda_i I)^{j+1} - \dim \ker (T - \lambda_i I)^{j-1}

Vectors propis generalitzats[modifica | modifica el codi]

Article principal: Vector propi generalitzat

Considerem la matriu A de l'exemple de la secció anterior. La forma canònica de Jordan s'obté arran d'una transformació lineal P−1AP = J, és a dir

\; AP = PJ.

Suposem que P té vectors columna pi, i = 1, ..., 4; aleshores

A \begin{pmatrix} p_1 & p_2 & p_3 & p_4 \end{pmatrix} = \begin{pmatrix} p_1 & p_2 & p_3 & p_4 \end{pmatrix}
\begin{pmatrix}
1 & 0 & 0 & 0 \\
0 & 2 & 0 & 0 \\ 
0 & 0 & 4 & 1 \\
0 & 0 & 0 & 4 \end{pmatrix} = \begin{pmatrix} p_1 & 2p_2 & 4p_3 & p_3+4p_4 \end{pmatrix}.

Podem veure que

\; (A - 1 I) p_1 = 0
\; (A - 2 I) p_2 = 0
\; (A - 4 I) p_3 = 0
\; (A - 4 I) p_4 = p_3.

Per i = 1,2,3 tenim p_i \in \operatorname{Ker}(A-\lambda_{i} I), és a dir, pi és un vector propi de A corresponent al valor propi λi. Per i=4, multiplicant ambdós costats de la igualtat per (A-4I) tenim

\; (A-4I)^2 p_4 = (A-4I) p_3.

Però (A-4I)p_3 = 0, per tant

\; (A-4I)^2 p_4 = 0.

Així, p_4 \in \operatorname{Ker}(A-4 I)^2.

Vectors com ara p_4 s'anomenen vectors propis generalitzats de A.

Així, donat un valor propi λ, el corresponent bloc de Jordan dóna lloc a una cadena de Jordan. El generador, o vector generador, per exemple pr, de la cadena és un vector generalitzat tal que (A − λ I)rpr = 0, on r és la mida del bloc de Jordan. El vector p1 = (A − λ I)r−1pr és un vector propi corresponent a λ. En general, pi és una antiimatge de pi−1 per A − λ I. Així doncs, el vector generador efectivament genera la cadena mitjançant multiplicacions per (A − λ I).

En conclusió, la proposició de què qualsevol matriu quadrada A pot escriure's en forma canònica de Jordan és equivalent a la proposició de què existeix una base consistent en només vectors propis i vectors propis generalitzats de A.[19]

Demostració d'existència[modifica | modifica el codi]

En aquest apartat, demostrarem l'existència d'una base de vectors propis i vectors propis generalitzats de A, la qual cosa implica que A pot ser escrita en forma canònica de Jordan; en donarem una demostració per inducció.

El cas 1 × 1 és trivial. Sigui A una matriu complexa n × n. Escollim qualsevol valor propi λ de A. El rang de A − λ I, denotat per Rang(A − λ I), és un subespai invariant de A. Addicionalment, com que λ és un valor propi de A, la dimensió de Rang(A − λ I), r, és estrictament menor que n. Sigui A' la restricció de A a Rang(A − λ I). Per hipòtesi d'inducció, existeix una base {p1, ..., pr} tal que A' , expressada en termes d'aquesta base, és en forma canònica de Jordan.

Considerem ara el subespai Ker(A − λ I). Si

\mathrm{Rang}(A - \lambda I) \cap \mathrm{Ker}(A - \lambda I) = \{0\},

el resultat desitjat és conseqüència immediata del Teorema de la dimensió per espais vectorials. Així seria si, per exemple, A fos hermítica.

Altrament, si

Q = \mathrm{Rang}(A - \lambda I) \cap \mathrm{Ker}(A - \lambda I) \neq \{0\},

sigui sr la dimensió de Q. Tot vector de Q és un vector propi de A' corresponent al valor propi λ. Així doncs, la forma de Jordan de A' ha de tenir s cadenes de Jordan corresponents a s vectors propis linealment independents. Per tant, la base {p1, ..., pr} ha de contenir s vectors, diguem-ne {prs+1, ..., pr}, que són vectors principals d'aquestes cadenes de Jordan de la forma canònica de Jordan de A'. Podem "estendre les cadenes" tot prenent les antiimatges d'aquests vectors principals. (Aquest és el pas clau de l'argumentació; en general, els vectors propis generalitzats no pertanyen a Rang(A − λ I).) Sigui qi tal que

\; (A - \lambda I) q_i = p_i \mbox{ per } i = r-s+1, \ldots, r.

Clarament, una combinació lineal no trivial dels qi pot pertànyer a Ker(A − λ I). A més, cap combinació lineal no trivial dels qi pot pertànyer a Rang(A − λ I), perquè això contradiria la suposició que tots els pi són vectors principals d'una cadena de Jordan. El conjunt {qi}, en ser antiimatges del conjunt linealment independent {pi} per A − λ I, també és linealment independent.

Finalment, podem escollir qualsevol conjunt linealment independent {z1, ..., zt} que generi

\; \mathrm{Ker}(A - \lambda I) / Q.

Per construcció, la unió dels tres conjunts {p1, ..., pr}, {qrs +1, ..., qr}, i {z1, ..., zt} és linealment independent. Tot vector d'aquesta unió de conjunts és o bé un vector propi o bé un vector propi generalitzat de A. Finalment, pel Teorema de la dimensió, la cardinalitat de la unió és n. En altres paraules, hem trobat una base formada per vectors propis i vectors propis generalitzats de A, i això demostra que A pot ser escrita en forma canònica de Jordan.[20]

Unicitat[modifica | modifica el codi]

Es pot demostrar que la forma canònica de Jordan d'una matriu A és única llevat de l'ordre dels blocs de Jordan.[21]

No n'hi ha prou amb conèixer les multiplicitats algebraica i geomètrica dels valors propis per tal de determinar la forma canònica de Jordan de A. Si coneixem la multiplicitat algebraica m(λ) d'un valor propi λ, l'estructura de la forma de Jordan es pot determinar analitzant els rangs de les potències (A − λ I)m(λ). Per veure això, suposem que A és una matriu n × n matrix A i que té només un valor propi λ. Així doncs, m(λ) = n. L'enter més petit k1 tal que

(A - \lambda I)^{k_1} = 0

és la mida del bloc de Jordan més gran de la forma de Jordan de A. (Aquest número k1 també s'anomena índex de λ. Vegeu-ne la discussió en una secció més endavant.) El rang de

(A - \lambda I)^{k_1 - 1}

és el nombre de blocs de Jordan de mida k1. Similarment, el rang de

(A - \lambda I)^{k_1 - 2}

és el doble del nombre de blocs de Jordan de mida k1 més el nombre de blocs de Jordan de mida k1 − 1. Si continuem iterant, obtenim l'estructura de Jordan de A. El cas general és similar.

Podem usar aquest procediment per demostrar la unicitat de la forma de Jordan. Siguin J1 i J2 dues formes normals de Jordan per A. Aleshores J1 i J2 són semblants i tenen el mateix espectre, tenint en compte les multiplicitats dels valors propis.[22] Podem usar el procediment esbosat al paràgraf anterior per determinar l'estructura d'aquestes matrius. Com que el rang d'una matriu es preserva per semblances, hi ha una bijecció entre els blocs de Jordan de J1 i J2. Això demostra la unicitat de la proposició.

Matrius reals[modifica | modifica el codi]

Si A és una matriu real, la seva forma de Jordan pot escriure's a entrades no-reals. Tot i això, existeix una matriu real invertible P tal que P-1AP = J és una matriu diagonal per blocs real, on cada bloc és un bloc de Jordan real. Un bloc de Jordan real és o bé idèntic a un bloc de Jordan complex (si el corresponent valor propi \lambda_k és real), o bé és una matriu per blocs, consistent en blocs de mida 2×2 amb la següent estructura (per valors propis no-reals \lambda_k = a_k+ib_k ). Els blocs diagonals són idèntics, de la forma

C_i = 
\begin{pmatrix}
a_i  & b_i \\
-b_i & a_i \\ 
\end{pmatrix}

i descriuen la multiplicació per \lambda_i dins el pla complex. Els blocs de la superdiagonal són matrius identitat 2×2. La forma completa del bloc de Jordan a entrades reals ve donat per

J_i = 
\begin{pmatrix}
C_i    & I       & \;     & \;    \\
\;     & C_i     & \ddots & \;    \\     
\;     & \;      & \ddots & I     \\
\;     & \;      & \;     & C_i   \\
\end{pmatrix}.

Aquesta forma de Jordan real és una conseqüència de la forma de Jordan complexa. Per una matriu real, els vectors propis i vectors propis generalitzats no-reals sempre es poden escollir per formar parells conjugats complexos. Prenent les parts real i imaginària (que són combinació lineal del vector i el seu conjugat), la matriu pren aquesta forma en la nova base.

Noteu que la forma de Jordan real definida així no compleix la definició de forma de Jordan que hem donat al principi de l'article, sinó que n'és una generalització.

Conseqüències[modifica | modifica el codi]

Hom pot veure que la forma canònica de Jordan és, essencialment, resultat d'una classificació de matrius quadrades, i per tant molts resultats importants de l'àlgebra lineal poden ser vistos com a conseqüències.

Teorema espectral[modifica | modifica el codi]

Usant la forma canònica de Jordan, un càlcul directe dóna un teorema espectral per l'anàlisi funcional: Sigui A una matriu n × n amb valors propis λ1, ..., λn; aleshores per qualsevol polinomi p, p(A) té valors propis p1), ..., pn).

Teorema de Cayley–Hamilton[modifica | modifica el codi]

El Teorema de Cayley-Hamilton afirma que tota matriu A satisfà la seva equació característica: si p és el polinomi característic de A, llavors p(A) = 0.[23] Això es pot demostrar mitjançant càlcul directe sobre la forma de Jordan, ja que qualsevol bloc de Jordan per λ s'anul·la per (X − λ)m on m és la multiplicitat de l'arrel λ de p, la suma de les mides dels blocs de Jordan per λ, i per tant igual o més gran que la mida del bloc en qüestió. Pot assumir-se que la forma de Jordan existeix sobre una extensió del cos base de la matriu, per exemple el cos de descomposició de p; aquesta extensió no canvia la matriu p(A) en absolut.

Polinomi mínim[modifica | modifica el codi]

El polinomi mínim P d'una matriu quadrada A és l'únic polinomi mònic de grau mínim, m, tal que P(A) = 0. Alternativament, el conjunt de polinomis que anul·len A formen un ideal I dins \mathbb{C}[x], el domini d'ideals principals de polinomis a coeficients complexos. L'element mònic que genera I és precisament P.

Siguin λ1, ..., λq els diferents valors propis de A, i sigui si la mida del bloc de Jordan més gran corresponent a λi. És clar de la forma canònica de Jordan que el polinomi mínim de A té grau Σsi.

Si bé és cert que la forma canònica de Jordan determina el polinomi mínim, l'invers no és cert. Això porta a la noció de divisors elementals. Els divisors elementals d'una matriu quadrada A són els polinomis característics dels seus blocs de Jordan.[24] Els factors del polinomi mínim m són els divisors elementals dels de grau màxim corresponents a valors propis diferents.

El grau d'un divisor elemental és la mida del corresponent bloc de Jordan, i per tant la dimensió del corresponent subespai invariant. Si tots els divisors elementals són lineals, aleshores A és diagonalitzable.

El polinomi mínim d'una matriu n×n divideix el seu polinomi característic.[25] De fet, el polinomi mínim i el polinomi característic d'una matriu quadrada A tenen els mateixos divisors elementals.[26]

Descomposicions en subespais invariants[modifica | modifica el codi]

La forma de Jordan d'una matriu A n × n és diagonal per blocs, i això dóna una descomposició dels n espais dimensionals euclidians en subespais invariants de A. Cada bloc de Jordan Ji correspon a un subespai invariant Xi. Simbòlicament, escrivim

\mathbb{C}^n = \bigoplus_{i = 1}^k X_i

on cada Xi és un subespai generat per la corresponent cadena de Jordan, k és el nombre de cadenes de Jordan i el símbol \bigoplus indica que es tracta d'una suma directa.

Es pot obtenir una descomposició lleugerament diferent via la forma de Jordan. Donat un valor propi λi, la mida del seu major bloc de Jordan si s'anomena índex de λi i es denota per ν(λi). (Llavors el grau del polinomi mínim és la suma de tots aquests índexs.) Definim un subespai Yi com

\; Y_i = \operatorname{Ker} (\lambda_i - A)^{\nu(\lambda_i)}.

Això ens dóna la descomposició

\mathbb{C}^n = \bigoplus_{i = 1}^\ell Y_i

on \ell és el nombre de valors propis diferents de A. Intuïtivament, unifiquem els subespais invariants pels blocs de Jordan corresponents al mateix valor propi. En el cas extrem en què A és un múltiple de la matriu identitat, tenim k = n i \ell = 1.

La projecció sobre Yi i al llarg dels altres Yj (ji) s'anomena la projecció espectral de A en λi i se sol denotar com Pi ; A). Les projeccions espectrals són mútuament ortogonals, en el sentit que Pi ; A) Pj ; A) = 0 si ij. També són commutatives amb A i la seva suma és la matriu identitat. Substituint cada λi en la matriu de Jordan J per 1 i substituint per 0 totes les altres entrades, obtenim Pi ; J); addicionalment, si U J U -1 és la transformació lineal tal que A = U J U -1, aleshores Pi ; A) = U Pi ; J) U -1. No hi estem limitats a dimensions finites. Vegeu més avall les aplicacions a operadors compactes, i al càlcul funcional holomorf per a una discussió més general.

Comparant les dues descomposicions, notem que, en general, \ell \leq k. Quan A és normal, els subespais Xi en la primera descomposició són unidimensionals i mútuament ortogonals. Això és el teorema espectral per operadors normals. La segona descomposició es pot generalitzar més fàcilment per operadors compactes generals dins espais de Banach.

És interessant fer notar algunes propietats de l'índex ν(λ). Més generalment, donat un número complex λ, el seu índex pot definir-se com el mínim enter no-negatiu ν(λ) tal que

\mathrm{Ker}(\lambda - A)^{\nu(\lambda)} = \operatorname{Ker} (\lambda - A)^m, \; \forall m \geq \nu(\lambda) .

Així, ν(λ) > 0 si i només si λ és un valor propi de A. En el cas de dimensió finita, ν(λ) ≤ la multiplicitat algebraica de λ.

Generalitzacions[modifica | modifica el codi]

Matrius amb entrades en un cos[modifica | modifica el codi]

La reducció de Jordan es pot estendre a qualsevol matriu quadrada M amb entrades a un cos K. El resultat afirma que qualsevol M es pot escriure com una suma D + N, on D és un operador semisimple, N és nilpotent, i DN = ND. D'això se'n diu descomposició de Jordan–Chevalley. Si K conté els valors propis de M, en particular quan K és algebraicament tancat, la forma canònica es pot expressar com suma directa de blocs de Jordan.

De forma similar al cas on K és el cos dels números complexos, el fet de conèixer les dimensions dels nuclis de (M − λI)k per 1 ≤ km, on m és la multiplicitat algebraica del valor propi λ, ens permet determinar la forma de Jordan de M. Podem visualitzar l'espai vectorial subjacent V com a un K[x]-mòdul si ens fixem en l'acció de x sobre V com a aplicació de M i estenent per K-linealitat. Aleshores els polinomis (x − λ)k són els divisors elementals de M, i la forma canònica de Jordan s'obté representant M en termes de blocs associats als divisors elementals.

La demostració de l'existència de la forma canònica de Jordan normalment és una conseqüència de l'aplicació a l'anell K[x] del Teorema d'estructura dels mòduls finitament generats sobre un domini d'ideals principals, del qual n'és un corol·lari.

Si l'espai vectorial és sobre un cos K, aleshores existeix una base en la qual existeix una tal matriu si i només si tots els valors propis de M són de K, o equivalentment si el polinomi característic de l'operador es pot descompondre en factors lineals sobre K.[14] Aquesta condició sempre se satisfà si K és el cos dels números complexos. En qualsevol cas, sempre es pot estendre el cos base K a un cos en què els polinomis característic i mínim es factoritzin en polinomis lineals.[14]

Funcions de matrius[modifica | modifica el codi]

Siguin A\in\mathbb{M}_n (\mathbb{C}) (matriu complexa de dimensió n\times n) i C\in\mathrm{GL}_n (\mathbb{C}) el canvi de base per la forma canònica de Jordan de A, és a dir, A=C^{-1}JC.

Sigui ara f(z) una funció holomorfa definida sobre un conjunt obert \mathit{\Omega} tal que \mathrm{spec}A\subset \mathit{\Omega}\subseteq\mathbb{C}, és a dir, tal que l'espectre de la matriu estigui contingut dins el domini d'holomorfia de f. Sigui

f(z)=\sum_{h=0}^{\infty}a_h (z-z_0)^h

el desenvolupament en sèrie de potències de f al voltant de z_0\in\mathit{\Omega}\backslash\mathrm{spec}A, que a partir d'ara suposarem 0 per simplificar. La matriu f(A) es pot definir mitjançant la següent sèrie formal de potències

f(A)=\sum_{h=0}^{\infty}a_h A^h

que és absolutament convergent respecte a la norma euclidiana de \mathbb{M}_n (\mathbb{C}). En altres paraules, f(A)\, convergeix absolutament per qualsevol matriu quadrada amb radi espectral més petit que el radi de convergència de f al voltant de 0 i és uniformement convergent sobre qualsevol subconjunt compacte de \mathbb{M}_n (\mathbb{C}) que satisfà aquesta propietat en la topologia de grup de Lie.

La forma canònica de Jordan permet avaluar funcions de matrius sense calcular explícitament una sèrie infinita, que és precisament un dels grans avantatges de les matrius de Jordan. Usant el fet que la k-sima potència (k\in\mathbb{N}_0) d'una matriu per blocs diagonal és la matriu diagonal per blocs on cada bloc és la k-sima potència del bloc original respectiu, és a dir, \left(A_1 \oplus A_2 \oplus A_3 \oplus\ldots\right)^k=A^k_1 \oplus A_2^k \oplus A_3^k \oplus\ldots, i que A^k=C^{-1}J^k C\,, l'anterior sèrie de potències esdevé

f(A)=C^{-1}f(J)C=C^{-1}\left(\bigoplus_{k=1}^N f\left(J_{\lambda_k ,m_k}\right)\right)C

on no cal calcular explícitament per sèries de potències cada bloc de Jordan. De fet, si \lambda\in\mathit{\Omega}, tota funció holomorfa avaluada sobre un bloc de Jordan f(J_{\lambda,n})\, té la forma de la següent matriu triangular superior:

f(J_{\lambda,n})=\left(\begin{matrix}
f(\lambda) & f^\prime (\lambda) & \frac{f^{\prime\prime}(\lambda)}{2} & \cdots & \frac{f^{(n-2)}(\lambda)}{(n-2)!} & \frac{f^{(n-1)}(\lambda)}{(n-1)!} \\
0 & f(\lambda) & f^\prime (\lambda) & \cdots & \frac{f^{(n-3)}(\lambda)}{(n-3)!} & \frac{f^{(n-2)}(\lambda)}{(n-2)!} \\
0 & 0 & f(\lambda) & \cdots & \frac{f^{(n-4)}(\lambda)}{(n-4)!} & \frac{f^{(n-3)}(\lambda)}{(n-3)!} \\
\vdots & \vdots & \vdots & \ddots & \vdots & \vdots \\
0 & 0 & 0 & \cdots & f(\lambda) & f^\prime (\lambda) \\
0 & 0 & 0 & \cdots & 0 & f(\lambda) \\
\end{matrix}\right)=\left(\begin{matrix}
a_0 & a_1 & a_2 & \cdots & a_{n-2} & a_{n-1} \\
0 & a_0 & a_1 & \cdots & a_{n-3} & a_{n-2} \\
0 & 0 & a_0 & \ddots & \ddots & a_{n-3} \\
\vdots & \vdots & \vdots & \ddots &  \ddots &\vdots \\
0 & 0 & 0 & \cdots& a_0 & a_1 \\
0 & 0 & 0 & \cdots& 0 & a_0
\end{matrix}\right).

Com a conseqüència, el càlcul de funcions sobre matrius és força directe quan es coneixen la seva forma canònica de Jordan i la matriu de canvi de base.

Addicionalment, \mathrm{spec}f(A)=f(\mathrm{spec}A), és a dir, tot valor propi \lambda\in\mathrm{spec}A es correspon amb el valor propi f(\lambda)\in\mathrm{spec}f(A), però té (en general), diferents multiplicitat algebraica, multiplicitat geomètrica i índex. Tot i això, es pot calcular la multiplicitat algebraica de la següent forma:

\text{mul}_{f(A)}f(\lambda)=\sum_{\mu\in\text{spec}A\cap f^{-1}(f(\lambda))}~\text{mul}_A \mu.\,

També es pot definir de forma similar la funció f(T) d'una transformació lineal T entre espais vectorials, d'acord al càlcul funcional holomorf, on juguen un rol fonamental les teories d'espai de Banach i de superfície de Riemann.

Operadors compactes[modifica | modifica el codi]

En una direcció diferent, tenim un resultat similar a la forma canònica de Jordan per operadors compactes en un espai de Banach. Ens hem de restringir a operadors compactes perquè qualsevol punt x dins l'espectre d'un operador compacte T és un valor propi, només amb l'excepció de quan x és el punt límit de l'espectre. Això no és cert en general per operadors acotats. Per donar una idea d'aquesta generalització, primer reformulem la descomposició de Jordan en termes d'anàlisi funcional.

Càlcul funcional holomorf[modifica | modifica el codi]

Per més detalls sobre aquest tema, vegeu càlcul funcional holomorf

Siguin X un espai de Banach i L(X) els operadors acotats de X, i denotem per σ(T) l'espectre de TL(X). Es defineix com a càlcul funcional holomorf el següent:

Fixem un operador acotat T. Considerem la família Hol(T) de funcions complexes que és holomorfa en algun conjunt obert G que conté σ(T). Sigui Γ = {γi} una col·lecció finita de corbes de Jordan tals que σ(T) està a l'interior de Γ. Definim f(T) com

f(T) = \frac{1}{2 \pi i} \int_{\Gamma} f(z)(z - T)^{-1} dz.

El conjunt obert G pot variar amb f i pot ser no connex. La integral es defineix com el límit de les sumes de Riemann, de la mateixa forma que en el cas escalar. Tot i que la integral té sentit per f contínua, ens restringim a funcions holomorfes per poder aplicar la maquinària de la teoria de funcions clàssica (p.ex. la fórmula integral de Cauchy). Com que hem suposat que σ(T) està a l'interior de Γ, llavors f(T) està ben definida; no depèn de l'elecció de Γ. El càlcul funcional és la funció Φ de Hol(T) a L(X) donada per

\; \Phi(f) = f(T).

Necessitem les següents propietats d'aquest càlcul funcional:

  1. Φ estén el càlcul funcional polinomial.
  2. El teorema de descomposició espectral diu que: σ(f(T)) = f(σ(T)).
  3. Φ és un homomorfisme d'àlgebres.

El cas de dimensió finita[modifica | modifica el codi]

En el cas de dimensió finita, σ(T) = {λi} és un conjunt discret finit dins el pla complex. Sigui ei la funció que val 1 en algun entorn obert de λi i 0 altrament. Per la propietat 3 del càlcul funcional, l'operador

\; e_i(T)

és una projecció. Addicionalment, sigui νi l'índex de λi i

f(z)= (z - \lambda_i)^{\nu_i}.

El teorema de descomposició espectral ens diu que

 f(T) e_i (T) = (T - \lambda_i)^{\nu_i} e_i (T)

té espectre {0}. Per la propietat 1, f(T) es pot calcular directament en la forma de Jordan, i per inspecció, veiem que l'operador f(T)ei(T) és la matriu nul·la.

Per la propietat 2, f(T) ei(T) = ei(T) f(T). Així doncs, ei(T) és precisament la projecció sobre el subespai

\mathrm{Rang} \; e_i (T) = \mathrm{Ker}(T - \lambda_i)^{\nu_i}.

La relació

\; \sum_i e_i = 1

implica

\mathbb{C}^n = \bigoplus_i \; \mathrm{Rang}\; e_i (T) = \bigoplus_i \; \mathrm{Ker}(T - \lambda_i)^{\nu_i}

on l'índex i recorre els diferents valors propis de T. Aquesta és exactament la descomposició en subespais invariants

\mathbb{C}^n = \bigoplus_i Y_i

que hem vist en una secció anterior. Cada ei(T) és la projecció sobre el subespai general per les cadenes de Jordan corresponents a λi i al llarg dels subespais generats per les cadenes de Jordan corresponents a λj per ji. En altres paraules, ei(T) = Pi;T). Aquesta identificació explícita dels operadors ei(T) ens dóna una forma explícita del càlcul funcional holomorf per matrius:

Per tota f ∈ Hol(T),
f(T) = \sum_{\lambda_i \in \sigma(T)} \sum_{k = 0}^{\nu_i -1} \frac{f^{(k)}}{k!} (T - \lambda_i)^k e_i (T).

Notem que l'expressió de f(T) és una suma finita perquè, en cada entorn de λi, hem escollit l'expansió en sèries de Taylor de f centrada en λi.

Pols d'un operador[modifica | modifica el codi]

Siguin T un operador acotat, i λ un punt aïllat de σ(T). (Com hem dit abans, si T és compacte, tot punt del seu espectre és un punt aïllat, excepte possiblement el punt límit 0.)

El punt λ s'anomena pol de l'operador T amb ordre ν si la funció resolvent RT definida per

\; R_T(\lambda) = (\lambda - T)^{-1}

té un pol d'ordre ν a λ.

Demostrarem que, en el cas de dimensió finita, l'ordre d'un valor propi coincideix amb el seu índex. El resultat també és vàlid per operadors compactes.

Considerem la regió anular A centrada al valor propi λ amb un radi ε suficientment petit de tal manera que la intersecció del disc obert Bε(λ) i σ(T) és {λ}. La funció resolvent RT és holomorfa en A. Estenent un resultat de la teoria de funcions clàssica, RT té una representació en Sèrie de Laurent en A:

R_T(z) = \sum _{- \infty} ^{\infty} a_m (\lambda - z)^m

on

a_{-m} = - \frac{1}{2 \pi i} \int_C (\lambda - z) ^{m-1} (z - T)^{-1} d z i C és un petit cercle centrat a λ.

Pel que hem vist sobre càlcul funcional,

\; a_{-m} = -(\lambda - T)^{m-1} e_{\lambda} (T) on \; e_{\lambda} val 1 a \; B_{\epsilon}(\lambda) i 0 altrament.

Però hem vist que el menor enter positiu m tal que

a_{-m} \neq 0 i a_{-l} = 0 \; \; \forall \; l \geq m

és precisament l'índex de λ, ν(λ). En altres paraules, la funció RT té un pol d'ordre ν(λ) en λ.

Exemples de càlcul[modifica | modifica el codi]

Exemple 1[modifica | modifica el codi]

Aquest exemple mostra com calcular la forma canònica de Jordan d'una matriu donada. Com s'explica a la secció següent, és important fer els càlculs exactes en comptes d'arrodonir els resultats.

Considerem la matriu

A =
\begin{pmatrix}
 5 &  4 &  2 &  1 \\
 0 &  1 & -1 & -1 \\
-1 & -1 &  3 &  0 \\ 
 1 &  1 & -1 &  2
\end{pmatrix}

la qual hem vist a l'inici de l'article.

El polinomi característic de A és

 \det(A-\lambda I) = \lambda^4 - 11 \lambda^3 + 42 \lambda^2 - 64 \lambda + 32 = (\lambda-1)(\lambda-2)(\lambda-4)^2. \,

Això ens diu que els valors propis són 1, 2, 4 i 4, d'acord amb la multiplicitat algebraica. Podem calcular l'espai propi corresponent al valor propi 1 tot resolent l'equació Av = λ v. Aquest espai és generat pel vector columna v = (−1, 1, 0, 0)T. De forma semblant, l'espai propi corresponent al valor propi 2 està generat per w = (1, −1, 0, 1)T. Finalment, l'espai propi corresponent al valor propi 4 també és unidimensional (encara que és un valor propi doble), i està generat per x = (1, 0, −1, 1)T. Així doncs, la multiplicitat geomètrica (és a dir, la dimensió de l'espai propi del valor propi donat) de cadascun dels tres valors propis és 1. Per tant, els dos valors propis iguals a 4 corresponen a un sol bloc de Jordan, i la forma canònica de Jordan de la matriu A és la suma directa

 J = J_1(1) \oplus J_1(2) \oplus J_2(4) = 
\begin{pmatrix} 1 & 0 & 0 & 0 \\ 0 & 2 & 0 & 0 \\ 0 & 0 & 4 & 1 \\ 0 & 0 & 0 & 4 \end{pmatrix}.

Hi ha tres cadenes. Dues tenen longitud 1: {v} i {w}, corresponents als valors propis 1 i 2, respectivament. Hi ha una cadena de longitud 2, corresponent al valor propi 4. Per trobar aquesta cadena, calculem

\ker{(A-4I)}^2 = \left\langle \begin{pmatrix} 1 \\ 0 \\ 0 \\ 0 \end{pmatrix}, \begin{pmatrix} 1 \\ 0 \\ -1 \\ 1 \end{pmatrix} \right\rangle.

Aquí la notació \langle \cdot \rangle indica subespai vectorial generat. Prenem un vector dintre de l'anterior espai generat que no pertanyi al nucli de A − 4I, p.ex., y = (1,0,0,0)T. Ara, (A − 4I)y = x i (A − 4I)x = 0, per tant {y, x} és una cadena de longitud 2 corresponent al valor propi 4.

La matriu de transició P tal que P−1AP = J es pot formar col·locant aquests vectors un al costat de l'altre, de la següent manera:

 P = \Big( \,v\, \Big| \,w\, \Big| \,x\, \Big| \,y\, \Big) = 
\begin{pmatrix}
-1 &  1 &  1 &  1 \\
 1 & -1 &  0 &  0 \\ 
 0 &  0 & -1 &  0 \\
 0 &  1 &  1 &  0
\end{pmatrix}.

Un càlcul senzill mostra que es compleix l'equació P−1AP = J.

P^{-1}AP=J=\begin{pmatrix}
1 & 0 & 0 & 0 \\
0 & 2 & 0 & 0 \\
0 & 0 & 4 & 1 \\
0 & 0 & 0 & 4 \end{pmatrix}.

Si haguéssim intercanviat l'ordre en el qual han aparegut els vectors de les cadenes, és a dir, si haguéssim canviat l'ordre de v, w i {x, y} junts, els blocs de Jordan s'haurien intercanviat. Tot i això, les formes de Jordan haurien estat equivalents.

Exemple 2[modifica | modifica el codi]

Considerem un endomorfisme f\in\mathrm{End}(E) amb matriu


A_f=\begin{pmatrix}
1 & -1 & -1 & -1 & -1 \\
1 & 3 & 1 & 1 & 1 \\
0 & 0 & 2 & 0 & 0 \\
0 & 0 & 0 & 1 & -1 \\
0 & 0 & 0 & 1 & 3
\end{pmatrix}.

El seu polinomi característic és \det(A_f-xI)=(2-x)^5. El rang de (f-2I) és 2 i, per tant, \mathrm{dim}\ \mathrm{Nuc}(f-2I)=3. A més, (f-2I)^2=0, i el polinomi mínim de f és (x-2)^2. El requadre considerat anteriorment té, en aquest cas, dues files i tres elements a la fila inferior:

u_{11} u_{12}
q(u_{11}) q(u_{12}) u_2

Podem agafar u_{11}=(1,0,0,0,0), u_{12}=(0,0,0,1,0). Llavors,


\begin{align}
q(u_{11}) &= (f-2I)(u_{11})=(-1,1,0,0,0) \\
q(u_{12}) &= (f-2I)(u_{12})=(-1,1,0,-1,1) \\
\end{align}

són dos vectors propis que, juntament amb u_2=(0,0,1,0,0), formen una base de vectors propis. En la base \{ u_{11}, q(u_{11}), u_{12}, q(u_{12}), u_2 \}, la matriu de f és[27]

J_f=\begin{pmatrix}
2 & 0 & \vline & 0 & 0 & \vline & 0 \\
1 & 2 & \vline & 0 & 0 & \vline & 0 \\
\hline
0 & 0 & \vline & 2 & 0 & \vline & 0 \\
0 & 0 & \vline & 1 & 2 & \vline & 0 \\
\hline
0 & 0 & \vline & 0 & 0 & \vline & 2 
\end{pmatrix}

Aplicacions[modifica | modifica el codi]

Anàlisi numèrica[modifica | modifica el codi]

Si la matriu A té valors propis múltiples, o és gairebé una matriu amb valors propis múltiples, llavors la seva forma canònica de Jordan és molt sensible a pertorbacions. Considerem per exemple la matriu

 A = \begin{pmatrix} 1 & 1 \\ \varepsilon & 1 \end{pmatrix}.

Si ε = 0, llavors la forma canònica de Jordan és simplement

 \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix}.

En canvi, per ε ≠ 0, la forma canònica de Jordan és

 \begin{pmatrix} 1+\sqrt\varepsilon & 0 \\ 0 & 1-\sqrt\varepsilon \end{pmatrix}.

El fet de tenir una matriu mal condicionada fa que sigui molt difícil desenvolupar un algorisme numèric robust per la forma canònica de Jordan, perquè el resultat depèn molt de si dos valors propis resulten ser molt propers. Per aquesta raó, se sol evitar la forma canònica de Jordan en anàlisi numèrica; normalment, la descomposició de Schur és una alternativa millor.[28][29]

Exponenciació i resolució de sistemes d'equacions diferencials ordinàries[modifica | modifica el codi]

Si n és un nombre natural, la n-sima potència d'una matriu en forma canònica de Jordan és una suma directa de matrius triangulars superiors, com a resultat de multiplicació de blocs. En concret, després de cada exponenciació cada bloc de Jordan esdevé un bloc triangular superior.

Per exemple,


\begin{pmatrix}
 2 & 1 & 0 & 0 & 0 \\
 0 & 2 & 1 & 0 & 0 \\
 0 & 0 & 2 & 0 & 0 \\ 
 0 & 0 & 0 & 5 & 1 \\
 0 & 0 & 0 & 0 & 5
\end{pmatrix}^4
=\begin{pmatrix}
 16 & 32 & 24 & 0   & 0 \\
 0  & 16 & 32 & 0   & 0 \\
 0  & 0  & 16 & 0   & 0 \\ 
 0  & 0  & 0  & 625 & 500 \\
 0  & 0  & 0  & 0   & 625
\end{pmatrix}.

Addicionalment, cada bloc triangular consisteix en λn a la diagonal principal, \tbinom{n}{1} vegades λn-1 a la superdiagonal, i així successivament. Aquesta expressió és vàlida per potències enteres negatives, posat que s'ampliï la noció dels coeficients binomials \tbinom{n}{k}\mapsto\left(\frac{n}{|n|}\right)^k\tbinom{|n|}{k}.

Per exemple,


\begin{pmatrix}
 \lambda_1 & 1 & 0 & 0 & 0 \\
 0 & \lambda_1 & 1 & 0 & 0 \\
 0 & 0 & \lambda_1 & 0 & 0 \\ 
 0 & 0 & 0 & \lambda_2 & 1 \\
 0 & 0 & 0 & 0 & \lambda_2
\end{pmatrix}^n
=\begin{pmatrix}
 \lambda_1^n & \tbinom{n}{1}\lambda_1^{n-1} & \tbinom{n}{2}\lambda_1^{n-2} & 0   & 0 \\
 0  & \lambda_1^n & \tbinom{n}{1}\lambda_1^{n-1} & 0   & 0 \\
 0  & 0  & \lambda_1^n & 0   & 0 \\ 
 0  & 0  & 0  & \lambda_2^n & \tbinom{n}{1}\lambda_2^{n-1} \\
 0  & 0  & 0  & 0   & \lambda_2^n
\end{pmatrix}.

Un sistema d'equacions diferencials ordinàries en y es pot reduir a una equació diferencial matricial d'ordre 1: u'(t) = Au(t) i la condició inicial u(0) = u_0, on u(t) és un vector columna que conté les derivades successives de y. En aquest cas, la resolució de l'equació és explícita, posat que el sistema tingui coeficients constants: u'(t) = exp(tA) u_0. L'avantatge de la forma canònica de Jordan rau en la facilitat dels càlculs que s'han de fer per obtenir les potències de la matriu. En efecte, l'exponencial d'un bloc de Jordan de mida p és:

\exp{(tJ_\lambda)} = \exp{(t\lambda)}\begin{pmatrix}
1 & t& \frac{t^2}{2} & \cdots & \frac{t^{p-1}}{(p-1)!} \\
0 & \ddots&\ddots & \ddots & \vdots \\
\vdots & \ddots & \ddots &t& \frac{t^2}{2} \\
\vdots & 0&\ddots & \ddots & t \\
0 & \cdots&\cdots & 0 & 1 \\ \end{pmatrix}.

Sistemes dinàmics[modifica | modifica el codi]

Suposem que un sistema dinàmic (complex) es defineix pel sistema d'equacions

\dot{\mathbf{z}}(t)=A(\mathbf{c})\mathbf{z}(t),
\mathbf{z}(0)=\mathbf{z}_0 \in\mathbb{C}^n,

on \mathbf{z}:\mathbb{R_+}\rightarrow \mathcal{R} és la parametrització de la corba (de dimensió n) d'una òrbita en la superfície de Riemann \mathcal{R} del sistema dinàmic, i A(\mathbf{c}) és una matriu complexa n\times n els elements de la qual són funcions complexes de paràmetre d-dimensional \mathbf{c}\in\mathbb{C}^d. Encara que A\in\mathbb{M}_n \left(\mathrm{C}^0(\mathbb{C}^d)\right) (és a dir, A depèn de forma contínua del paràmetre \mathbf{c}), la forma canònica de Jordan de la matriu està deformada contínuament quasi pertot \mathbb{C}^d però, en general, no a tot arreu: hi ha una subvarietat de \mathbb{C}^d on la forma de Jordan canvia bruscament d'estructura quan el paràmetre la creua o simplement la "recorre" (monodromia). Aquests canvis signifiquen que diversos blocs de Jordan (pertanyin a diferents valors propis o no) es fusionen per formar un únic bloc de Jordan, o a la inversa (és a dir, un bloc de Jordan es divideix en dos o més blocs de Jordan diferents). Molts aspectes de la teoria de bifurcació tant per sistemes dinàmics continus com discrets poden interpretar-se amb l'ajuda de l'anàlisi de matrius funcionals de Jordan.

Des del punt de vista de la dinàmica d'espais tangents, això vol dir que la descomposició ortogonal de l'espai de fases del sistema dinàmic canvia i, per exemple, diferents òrbites poden augmentar la seva periodicitat, o disminuir-la, o canviar d'un tipus de periodicitat a un altre (com ara duplicació de període, cfr. mapa logístic).

Simplificant, el comportament qualitatiu d'un tal sistema dinàmic pot canviar substancialment amb la deformació versal de la forma canònica de Jordan de A(\mathbf{c}).

Referències[modifica | modifica el codi]

  1. Shilov (1977) defineix el terme forma canònica de Jordan i en un peu de pàgina diu que forma normal de Jordan n'és un sinònim. Aquestes dues terminologies de vegades s'abreugen com forma de Jordan. El terme forma canònica clàssica també s'usa de vegades en aquest sentit. (James & James 1992)
  2. 2,0 2,1 2,2 Rojo, Jesús. Álgebra lineal. 2a. Madrid: AC, 1986, p. 277-308. ISBN 84-7288-120-2. 
  3. Lipschutz 1992, p. 442.
  4. 4,0 4,1 Paige, Dean Swift & Slobko 1982, p. 335.
  5. Castellet & Llerena 1988, p. 158.
  6. Brechenmacher, Frédéric. «A controversy and the writing of a history - The discussion of "small oscillations" (1760-1860) from the standpoint of the controversy between Jordan and Kronecker (1874)» (pdf) (en anglès). Bulletin of the Belgian Mathematical Society, 13, 2006 [Consulta: 19 octubre 2013].
  7. Brechenmacher, Frédéric. «Histoire du théorème de Jordan de la décomposition matricielle (1870-1930)» (pdf) (en francès). Revue d'histoire des mathématiques, 22 abril 2007 [Consulta: 19 octubre 2013].
  8. Paige, Dean Swift & Slobko 1982, p. 237, Teoremes 6.5 i 6.6.
  9. Jordan, Camille. «Sur la résolution des équations differentielles linéaires». Œuvres, IV, 1871, pàg. 313-318.
  10. Campos, Neila. «Endomorfismos y diagonalización» (pdf). Departamento de Matemática Aplicada y Ciencias de la Computación. Universidad de Cantabria. [Consulta: 13 octubre 2013].
  11. Stothers, Andrew James. «On the Complexity of Matrix Multiplication». PhD Thesis [University of Edinburgh], 2010, pàg. 12 [Consulta: 20 octubre 2013].
  12. Stark, J.. «Fundamental Theory of Dynamical Systems - The Jordan Canonical Form» (pdf). MSc in Nonlinear Dynamics and Chaos, 1994, pàg. 4 [Consulta: 20 octubre 2013].
  13. Alin, John S.; Starr, Collin L.. «Determinants - Computational Complexity» (pdf) (en anglès). Undergraduate Matrix Theory and Linear Algebra, 15 gener 2013, pàg. 167 [Consulta: 20 octubre 2013].
  14. 14,0 14,1 14,2 Lipschutz 1992, p. 441.
  15. Castellet & Llerena 1988, p. 158, Teorema 8.1.
  16. 16,0 16,1 16,2 Castellet & Llerena 1988, p. 159.
  17. 17,0 17,1 Horn & Johnson (2005, §3.2.1)
  18. Grone, Robert; Dusel, John. «Linear Algebra» (pdf) (en anglès). San Diego State University; University of California, Riverside p. 29 (Theorem 9.4). [Consulta: 13 octubre 2013].
  19. Chapman, Robin J. «Computing the Jordan Canonical Form» (pdf) (en anglès). Mathematics Research Institute, University of Exeter, 25 gener 1995. [Consulta: 27 octubre 2013].
  20. Nelson, Edward. «The Jordan Canonical Form». Department of Mathematics, Princeton University. [Consulta: 27 octubre 2013].
  21. Ortega, James M. Matrix theory : a second course. [2nd print.]. (en anglès). New York: Plenum Press, 1987. ISBN 978-0306424335. 
  22. Paige, Dean Swift & Slobko 1982, p. 338, Teorema 9.11.
  23. Paige, Dean Swift & Slobko 1982, p. 339, Corol·lari 2.
  24. Paige, Dean Swift & Slobko 1982, p. 339, Teorema 9.12.
  25. Paige, Dean Swift & Slobko 1982, p. 339, Corol·lari 1.
  26. Paige, Dean Swift & Slobko 1982, p. 339-340, Corol·lari 3.
  27. Castellet & Llerena 1988, p. 161.
  28. Golub & Van Loan 1996, §7.6.5.
  29. Golub & Wilkinson 1976.

Bibliografia[modifica | modifica el codi]

  • Dunford, Nelson; Schwartz, Jacob T.; amb l'assistència de William G. Bade i Robert G. Bartle. Linear operators (en anglès). Nova York: Wiley, 1988 (Wiley Classics Library). ISBN 0471608483. 
  • Castellet, Manuel; Llerena, Irene; amb la col·laboració de Carles Casacuberta. Àlgebra lineal i geometria. Bellaterra: Servei de Publicacions de la Universitat Autònoma, 1988. ISBN 84-7488-218-4. 
  • Finkbeiner, Daniel Talbot. Introduction to matrices and linear transformations. 3a ed. (en anglès). San Francisco: Freeman, 1978. ISBN 0716700840. 
  • James, Glenn; James, Robert C. Mathematics dictionary. 5a ed. (en anglès). Nova York: Chapman & Hall, 1992. ISBN 978-0412990410. 
  • Golub, Gene H.; Wilkinson, J.H. «Ill-conditioned systems and the computation of the Jordan canonical form» (en anglès). SIAM review, 18, 4, octubre 1976, pàg. 578-619 [Consulta: 6 octubre 2013].
  • Golub, Gene H.; Van Loan, Charles F. Matrix computations. 3a. ed. (en anglès). Baltimore [etc.]: Johns Hopkins Univ. Press, 1996. ISBN 978-0801854149. 
  • Horn, Roger A.; Johnson, Charles R. Matrix analysis. 19 ed. (en anglès). Cambridge [etc.]: Cambridge University Press, 2005. ISBN 978-0-521-38632-6. 
  • Lipschutz, Seymour; traducció de Celia Martínez Ontalba; revisió de Lorenzo Abellanas. Álgebra lineal. 2a. ed. (en castellà). Madrid: McGraw-Hill, 1992. ISBN 84-7615-758-4. 
  • Mac Lane, Saunders; Birkhoff, Garrett. Algebra. 3a. ed. (en anglès). Nova York: AMS Chelsea, 1999. ISBN 978-0821816462. 
  • Michel, Anthony N.; Herget, Charles J. Applied algebra and functional analysis. Unabridged corr. republication (en anglès). Nova York: Dover, 1993. ISBN 978-0486675985. 
  • Paige, Lowel J.; Dean Swift, J.; Slobko, Thomas A.; traducció R. Rodríguez Vidal. Elementos de álgebra lineal. 2a. ed. (en castellà). Barcelona: Reverté, 1982. ISBN 84-291-5097-8. 
  • Rowlan, Todd; Weisstein, Eric W. «Jordan canonical form» (html) (en anglès). MathWorld. [Consulta: 6 octubre 2013].
  • Shafarevich, Igor R.; Remizov, Alexey O.; traductors David Kramer, Lena Nukludova. Linear algebra and geometry (en anglès). Berlín: Springer, 2012. ISBN 978-3-642-30993-9. 
  • Shilov, Georgi E.; editor Richard A. Silverman. Linear algebra. edició revisada (en anglès). Nova York: Dover, 1977. ISBN 978-0486635187. 

Vegeu també[modifica | modifica el codi]

Enllaços externs[modifica | modifica el codi]