Skip to article frontmatterSkip to article content
Site not loading correctly?

This may be due to an incorrect BASE_URL configuration. See the MyST Documentation for reference.

Matrix inversie is een sleutel tot belangrijke mogelijkheden in Machine Learning. In de vorige sectie zagen we de identiteitsmatrix als speciale matrix. Deze spelen een centrale rol in de formele definitie van de matrix inverse A1\pmb{A}^{-1} van een matrix A\pmb{A}:

A1A=In\pmb{A}^{-1}\pmb{A} = \pmb{I}_n

De matrix inverse A1\pmb{A}^{-1} is de matrix die bij vermenigvuldiging met A\pmb{A} de identiteitsmatrix In\pmb{I}_n oplevert.

Stelsels van lineaire vergelijkingen

We kunnen matrix inverses gebruiken om oplossingen te vinden voor zogenaamde stelsels van lineaire vergelijkingen. De algemene vorm van een lineaire vergelijking is:

y=β1x1+β2x2++βnxny = \beta_1x_1 + \beta_2x_2 + \ldots + \beta_nx_n

We kunnen dit in vector notatie vertalen naar:

y=[β1β2βn]T[x1x2xn]y = \begin{bmatrix} \beta_1 & \beta_2 & \ldots & \beta_n\end{bmatrix}^T\begin{bmatrix} x_1 \cr x_2 \cr \vdots \cr x_n \end{bmatrix}

Bij een stelsel van lineaire vergelijkingen blijft b=[β1β2βn]T\pmb{b} = \begin{bmatrix} \beta_1 & \beta_2 & \ldots & \beta_n\end{bmatrix}^T constant, maar zijn er verschillende instanties van x=[x1x2xn]T\pmb{x} = \begin{bmatrix} x_1 & x_2 & \ldots & x_n\end{bmatrix}^T:

y1=β1x1,1+β2x1,2++βnx1,ny2=β1x2,1+β2x2,2++βnx2,nym=β1xm,1+β2xm,2++βnxm,n\begin{align} y_1 &= \beta_1x_{1,1} + \beta_2x_{1,2} + \ldots + \beta_nx_{1,n} \cr y_2 &= \beta_1x_{2,1} + \beta_2x_{2,2} + \ldots + \beta_nx_{2,n} \cr \ldots \cr y_m &= \beta_1x_{m,1} + \beta_2x_{m,2} + \ldots + \beta_nx_{m,n} \cr \end{align}

Dit kunnen compact in matrix notatie schrijven:

y=Xb\pmb{y} = \pmb{X}\pmb{b}

In een stelsel van vergelijkingen is het de bedoeling om een oplossing te vinden voor b\pmb{b}:

y=XbX1y=X1XbX1y=InbX1y=bb=X1y\begin{align} \pmb{y} &= \pmb{X}\pmb{b} \cr \pmb{X}^{-1}\pmb{y} &= \pmb{X}^{-1}\pmb{X}\pmb{b} \cr \pmb{X}^{-1}\pmb{y} &= \pmb{I}_n\pmb{b} \cr \pmb{X}^{-1}\pmb{y} &= \pmb{b} \cr \pmb{b} &= \pmb{X}^{-1}\pmb{y} \end{align}

We kunnen de vergelijkingen dus oplossen voor b\pmb{b} als we de inverse X1\pmb{X}^{-1} kunnen berekenen. Dat is helaas minder evident dan we zouden hopen, maar dat is voor een volgende sectie. Hier geven we een eenvoudig voorbeeld met een stelsel van 2 vergelijkingen en n=2n=2.

5=β1+3β24=2β1β2\begin{align} -5 &= \beta_1 + 3\beta_2 \cr 4 &= 2\beta_1 - \beta_2 \end{align}

We hebben dus:

y=[54]TX=[1321]\begin{align} \pmb{y} &= \begin{bmatrix} -5 & 4 \end{bmatrix}^T \cr \pmb{X} &= \begin{bmatrix} 1 & 3 \cr 2 & -1 \end{bmatrix} \end{align}

Om b\pmb{b} te vinden zoeken we de inverse van X\pmb{X} die voor het 2×22 \times 2 geval de volgende speciale vorm aanneemt:

X1=1det(X)[x2,2x1,2x2,1x1,1]=1x1,1x2,2x1,2x2,1[x2,2x1,2x2,1x1,1]\begin{align} \pmb{X}^{-1} &= \frac{1}{det(\pmb{X})}\begin{bmatrix} x_{2,2} & -x_{1,2} \cr -x_{2,1} & x_{1,1} \end{bmatrix} \cr &= \frac{1}{ x_{1,1}x_{2,2} - x_{1,2}x_{2,1} }\begin{bmatrix} x_{2,2} & -x_{1,2} \cr -x_{2,1} & x_{1,1} \end{bmatrix} \end{align}

We krijgen bijgevolg:

X1=113×2[1321]=17[1321]=[17372717]\begin{align} \pmb{X}^{-1} &= \frac{1}{ -1 - 3 \times 2 }\begin{bmatrix} -1 & -3 \cr -2 & 1 \end{bmatrix} \cr &= \frac{1}{-7}\begin{bmatrix} -1 & -3 \cr -2 & 1 \end{bmatrix} \cr &= \begin{bmatrix} \frac{1}{7} & \frac{3}{7} \cr \frac{2}{7} & -\frac{1}{7} \end{bmatrix} \end{align}

en voor de uiteindelijke oplossing b=X1y\pmb{b} = \pmb{X}^{-1}\pmb{y}

b=[17372717][54]=[17(5)+37(4)27(5)+(17)(4)]=[12]\begin{align} \pmb{b} &= \begin{bmatrix} \frac{1}{7} & \frac{3}{7} \cr \frac{2}{7} & -\frac{1}{7} \end{bmatrix} \begin{bmatrix} -5 \cr 4 \end{bmatrix} \cr &= \begin{bmatrix} \frac{1}{7}(-5) + \frac{3}{7}(4) \cr \frac{2}{7}(-5) + (-\frac{1}{7})(4) \end{bmatrix} \cr &= \begin{bmatrix} 1 \cr -2 \end{bmatrix} \end{align}

Ter verificatie:

5=(1)+(2)×3=16=54=(1)×2(2)=2+2=4\begin{align} -5 &= (1) + (-2) \times 3 = 1 - 6 = -5 \cr 4 &= (1) \times 2 - (-2) = 2 + 2 = 4 \end{align}