Matrix inversie is een sleutel tot belangrijke mogelijkheden in Machine Learning. In de vorige sectie zagen we de identiteitsmatrix als speciale matrix.
Deze spelen een centrale rol in de formele definitie van de matrix inverse A − 1 \pmb{A}^{-1} A A − 1 van een matrix A \pmb{A} A A :
A − 1 A = I n \pmb{A}^{-1}\pmb{A} = \pmb{I}_n A A − 1 A A = I I n De matrix inverse A − 1 \pmb{A}^{-1} A A − 1 is de matrix die bij vermenigvuldiging met A \pmb{A} A A de identiteitsmatrix I n \pmb{I}_n I I n oplevert .
Stelsels van lineaire vergelijkingen ¶ We kunnen matrix inverses gebruiken om oplossingen te vinden voor zogenaamde stelsels van lineaire vergelijkingen . De algemene vorm van een lineaire vergelijking is:
y = β 1 x 1 + β 2 x 2 + … + β n x n y = \beta_1x_1 + \beta_2x_2 + \ldots + \beta_nx_n y = β 1 x 1 + β 2 x 2 + … + β n x n We kunnen dit in vector notatie vertalen naar:
y = [ β 1 β 2 … β n ] T [ x 1 x 2 ⋮ x n ] y = \begin{bmatrix} \beta_1 & \beta_2 & \ldots & \beta_n\end{bmatrix}^T\begin{bmatrix}
x_1 \cr
x_2 \cr
\vdots \cr
x_n
\end{bmatrix} y = [ β 1 β 2 … β n ] T ⎣ ⎡ x 1 x 2 ⋮ x n ⎦ ⎤ Bij een stelsel van lineaire vergelijkingen blijft b = [ β 1 β 2 … β n ] T \pmb{b} = \begin{bmatrix} \beta_1 & \beta_2 & \ldots & \beta_n\end{bmatrix}^T b b = [ β 1 β 2 … β n ] T constant, maar zijn er verschillende instanties van
x = [ x 1 x 2 … x n ] T \pmb{x} = \begin{bmatrix} x_1 & x_2 & \ldots & x_n\end{bmatrix}^T x x = [ x 1 x 2 … x n ] T :
y 1 = β 1 x 1 , 1 + β 2 x 1 , 2 + … + β n x 1 , n y 2 = β 1 x 2 , 1 + β 2 x 2 , 2 + … + β n x 2 , n … y m = β 1 x m , 1 + β 2 x m , 2 + … + β n x m , n \begin{align}
y_1 &= \beta_1x_{1,1} + \beta_2x_{1,2} + \ldots + \beta_nx_{1,n} \cr
y_2 &= \beta_1x_{2,1} + \beta_2x_{2,2} + \ldots + \beta_nx_{2,n} \cr
\ldots \cr
y_m &= \beta_1x_{m,1} + \beta_2x_{m,2} + \ldots + \beta_nx_{m,n} \cr
\end{align} y 1 y 2 … y m = β 1 x 1 , 1 + β 2 x 1 , 2 + … + β n x 1 , n = β 1 x 2 , 1 + β 2 x 2 , 2 + … + β n x 2 , n = β 1 x m , 1 + β 2 x m , 2 + … + β n x m , n Dit kunnen compact in matrix notatie schrijven:
y = X b \pmb{y} = \pmb{X}\pmb{b} y y = X X b b In een stelsel van vergelijkingen is het de bedoeling om een oplossing te vinden voor b \pmb{b} b b :
y = X b X − 1 y = X − 1 X b X − 1 y = I n b X − 1 y = b b = X − 1 y \begin{align}
\pmb{y} &= \pmb{X}\pmb{b} \cr
\pmb{X}^{-1}\pmb{y} &= \pmb{X}^{-1}\pmb{X}\pmb{b} \cr
\pmb{X}^{-1}\pmb{y} &= \pmb{I}_n\pmb{b} \cr
\pmb{X}^{-1}\pmb{y} &= \pmb{b} \cr
\pmb{b} &= \pmb{X}^{-1}\pmb{y}
\end{align} y y X X − 1 y y X X − 1 y y X X − 1 y y b b = X X b b = X X − 1 X X b b = I I n b b = b b = X X − 1 y y We kunnen de vergelijkingen dus oplossen voor b \pmb{b} b b als we de inverse X − 1 \pmb{X}^{-1} X X − 1 kunnen berekenen.
Dat is helaas minder evident dan we zouden hopen, maar dat is voor een volgende sectie.
Hier geven we een eenvoudig voorbeeld met een stelsel van 2 vergelijkingen en n = 2 n=2 n = 2 .
− 5 = β 1 + 3 β 2 4 = 2 β 1 − β 2 \begin{align}
-5 &= \beta_1 + 3\beta_2 \cr
4 &= 2\beta_1 - \beta_2
\end{align} − 5 4 = β 1 + 3 β 2 = 2 β 1 − β 2 We hebben dus:
y = [ − 5 4 ] T X = [ 1 3 2 − 1 ] \begin{align}
\pmb{y} &= \begin{bmatrix}
-5 & 4
\end{bmatrix}^T \cr
\pmb{X} &= \begin{bmatrix}
1 & 3 \cr
2 & -1
\end{bmatrix}
\end{align} y y X X = [ − 5 4 ] T = [ 1 2 3 − 1 ] Om b \pmb{b} b b te vinden zoeken we de inverse van X \pmb{X} X X die voor het 2 × 2 2 \times 2 2 × 2 geval de volgende speciale vorm aanneemt:
X − 1 = 1 d e t ( X ) [ x 2 , 2 − x 1 , 2 − x 2 , 1 x 1 , 1 ] = 1 x 1 , 1 x 2 , 2 − x 1 , 2 x 2 , 1 [ x 2 , 2 − x 1 , 2 − x 2 , 1 x 1 , 1 ] \begin{align}
\pmb{X}^{-1} &= \frac{1}{det(\pmb{X})}\begin{bmatrix}
x_{2,2} & -x_{1,2} \cr
-x_{2,1} & x_{1,1}
\end{bmatrix} \cr
&= \frac{1}{
x_{1,1}x_{2,2} - x_{1,2}x_{2,1}
}\begin{bmatrix}
x_{2,2} & -x_{1,2} \cr
-x_{2,1} & x_{1,1}
\end{bmatrix}
\end{align} X X − 1 = d e t ( X X ) 1 [ x 2 , 2 − x 2 , 1 − x 1 , 2 x 1 , 1 ] = x 1 , 1 x 2 , 2 − x 1 , 2 x 2 , 1 1 [ x 2 , 2 − x 2 , 1 − x 1 , 2 x 1 , 1 ] We krijgen bijgevolg:
X − 1 = 1 − 1 − 3 × 2 [ − 1 − 3 − 2 1 ] = 1 − 7 [ − 1 − 3 − 2 1 ] = [ 1 7 3 7 2 7 − 1 7 ] \begin{align}
\pmb{X}^{-1} &= \frac{1}{
-1 - 3 \times 2
}\begin{bmatrix}
-1 & -3 \cr
-2 & 1
\end{bmatrix} \cr
&= \frac{1}{-7}\begin{bmatrix}
-1 & -3 \cr
-2 & 1
\end{bmatrix} \cr
&= \begin{bmatrix}
\frac{1}{7} & \frac{3}{7} \cr
\frac{2}{7} & -\frac{1}{7}
\end{bmatrix}
\end{align} X X − 1 = − 1 − 3 × 2 1 [ − 1 − 2 − 3 1 ] = − 7 1 [ − 1 − 2 − 3 1 ] = [ 7 1 7 2 7 3 − 7 1 ] en voor de uiteindelijke oplossing b = X − 1 y \pmb{b} = \pmb{X}^{-1}\pmb{y} b b = X X − 1 y y
b = [ 1 7 3 7 2 7 − 1 7 ] [ − 5 4 ] = [ 1 7 ( − 5 ) + 3 7 ( 4 ) 2 7 ( − 5 ) + ( − 1 7 ) ( 4 ) ] = [ 1 − 2 ] \begin{align}
\pmb{b} &= \begin{bmatrix}
\frac{1}{7} & \frac{3}{7} \cr
\frac{2}{7} & -\frac{1}{7}
\end{bmatrix} \begin{bmatrix}
-5 \cr
4
\end{bmatrix} \cr
&= \begin{bmatrix}
\frac{1}{7}(-5) + \frac{3}{7}(4) \cr
\frac{2}{7}(-5) + (-\frac{1}{7})(4)
\end{bmatrix} \cr
&= \begin{bmatrix}
1 \cr
-2
\end{bmatrix}
\end{align} b b = [ 7 1 7 2 7 3 − 7 1 ] [ − 5 4 ] = [ 7 1 ( − 5 ) + 7 3 ( 4 ) 7 2 ( − 5 ) + ( − 7 1 ) ( 4 ) ] = [ 1 − 2 ] Ter verificatie:
− 5 = ( 1 ) + ( − 2 ) × 3 = 1 − 6 = − 5 4 = ( 1 ) × 2 − ( − 2 ) = 2 + 2 = 4 \begin{align}
-5 &= (1) + (-2) \times 3 = 1 - 6 = -5 \cr
4 &= (1) \times 2 - (-2) = 2 + 2 = 4
\end{align} − 5 4 = ( 1 ) + ( − 2 ) × 3 = 1 − 6 = − 5 = ( 1 ) × 2 − ( − 2 ) = 2 + 2 = 4