Skip to content

Latest commit

 

History

History
86 lines (60 loc) · 4.56 KB

chapter14.md

File metadata and controls

86 lines (60 loc) · 4.56 KB

第十四讲:正交向量与子空间

在四个基本子空间中,提到对于秩为r的$m \times n$矩阵,其行空间($dim C(A^T)=r$)与零空间($dim N(A)=n-r$)同属于$\mathbb{R}^n$空间,其列空间($dim C(A)=r$)与左零空间($dim N(A^T)$=m-r)同属于$\mathbb{R}^m$空间。

对于向量$x, y$,当$x^T \cdot y=0$即$x_1y_1+x_2y_x+\cdots+x_ny_n=0$时,有向量$x, y$正交(vector orthogonal)。

毕达哥拉斯定理(Pythagorean theorem)中提到,直角三角形的三条边满足:

$$ \begin{aligned} \left|\overrightarrow{x}\right|^2+\left|\overrightarrow{y}\right|^2 &= \left|\overrightarrow{x+y}\right|^2 \\ x^Tx+y^Ty &= (x+y)^T(x+y) \\ x^Tx+y^Ty &= x^Tx+y^Ty+x^Ty+y^Tx \\ 0 &= x^Ty+y^Tx \qquad 对于向量点乘,x^Ty=y^Tx \\ 0 &= 2x^Ty \\ x^Ty &=0 \end{aligned} $$

由此得出,两正交向量的点积为$0$。另外,$x, y$可以为$0$向量,由于$0$向量与任意向量的点积均为零,所以$0$向量与任意向量正交。

举个例子: $x=\begin{bmatrix}1\2\3\end{bmatrix}, y=\begin{bmatrix}2\-1\0\end{bmatrix}, x+y=\begin{bmatrix}3\1\3\end{bmatrix}$,有$\left| \overrightarrow{x} \right|^2=14, \left| \overrightarrow{y} \right|^2=5, \left| \overrightarrow{x+y} \right|^2=19$,而$x^Ty=1\times2+2\times (-1)+3\times0=0$。

向量$S$与向量$T$正交,则意味着$S$中的每一个向量都与$T$中的每一个向量正交。若两个子空间正交,则它们一定不会相交于某个非零向量。

现在观察行空间与零空间,零空间是$Ax=0$的解,即$x$若在零空间,则$Ax$为零向量;

而对于行空间,有 $ \begin{bmatrix}row_1\row_2\ \vdots \row_m\end{bmatrix} \Bigg[x\Bigg]= \begin{bmatrix}0\0\ \vdots\ 0\end{bmatrix} $,可以看出: $$ \begin{bmatrix}row_1\end{bmatrix}\Bigg[x\Bigg]=0 \ \begin{bmatrix}row_2\end{bmatrix}\Bigg[x\Bigg]=0 \ \vdots \ \begin{bmatrix}row_m\end{bmatrix}\Bigg[x\Bigg]=0 \ $$

所以这个等式告诉我们,$x$同$A$中的所有行正交;

接下来还验证$x$是否与$A$中各行的线性组合正交, $ \begin{cases} c_1(row_1)^Tx=0 \ c_2(row_2)^Tx=0 \ \vdots \ c_n(row_m)^Tx=0 \ \end{cases} $,各式相加得$(c_1row_1+c_2row_2+\cdots+c_nrow_m)^Tx=0$,得证。

我们可以说,行空间与零空间将$\mathbb{R}^n$分割为两个正交的子空间,同样的,列空间与左零空间将$\mathbb{R}^m$分割为两个正交的子空间。

举例,$A=\begin{bmatrix}1&2&5\2&4&10\end{bmatrix}$,则可知$m=2, n=3, rank(A)=1, dim N(A)=2$。

有$Ax=\begin{bmatrix}1&2&5\2&4&10\end{bmatrix}\begin{bmatrix}x_1\x_2\x_3\end{bmatrix}=\begin{bmatrix}0\0\end{bmatrix}$,解得零空间的一组基$x_1=\begin{bmatrix}-2\1\0\end{bmatrix}\quad x_2=\begin{bmatrix}-5\0\1\end{bmatrix}$。

而行空间的一组基为$r=\begin{bmatrix}1\2\5\end{bmatrix}$,零空间与行空间正交,在本例中行空间也是零空间的法向量。

补充一点,我们把行空间与零空间称为$n$维空间里的正交补(orthogonal complement),即零空间包含了所有与行空间正交的向量;同理列空间与左零空间为$m$维空间里的正交补,即左零空间包含了所有与零空间正交的向量。

接下来看长方矩阵,$m>n$。对于这种矩阵,$Ax=b$中经常混入一些包含“坏数据”的方程,虽然可以通过筛选的方法去掉一些我们不希望看到的方程,但是这并不是一个稳妥的方法。

于是,我们引入一个重要的矩阵:$A^TA$。这是一个$n \times m$矩阵点乘$m \times n$矩阵,其结果是一个$n \times n$矩阵,应该注意的是,这也是一个对称矩阵,证明如下:

$$ (A^TA)^T=A^T(A^T)^T=A^TA $$

这一章节的核心就是$A^TAx=A^Tb$,这个变换可以将“坏方程组”变为“好方程组”。

举例,有$\begin{bmatrix}1&1\1&2\1&5\end{bmatrix}\begin{bmatrix}x_1\x_2\end{bmatrix}=\begin{bmatrix}b_1\b_2\b_3\end{bmatrix}$,只有当$\begin{bmatrix}b_1\b_2\b_3\end{bmatrix}$在矩阵的列空间时,方程才有解。

现在来看$\begin{bmatrix}1&1&1\1&2&5\end{bmatrix}\begin{bmatrix}1&1\1&2\1&5\end{bmatrix}=\begin{bmatrix}3&8\8&30\end{bmatrix}$,可以看出此例中$A^TA$是可逆的。然而并非所有$A^TA$都是可逆的,如$\begin{bmatrix}1&1&1\3&3&3\end{bmatrix}\begin{bmatrix}1&3\1&3\1&3\end{bmatrix}=\begin{bmatrix}3&9\9&27\end{bmatrix}$(注意到这是两个秩一矩阵相乘,其结果秩不会大于一)

先给出结论:

$$ N(A^TA)=N(A)\\ rank(A^TA)=rank(A)\\ A^TA可逆当且仅当N(A)为零向量,即A的列线性无关\\ $$

下一讲涉及投影,很重要。