TODO:

  • 零空間和列空間的映射圖

介紹這兩個概念前,需要回憶「向量空間」、「子空間」和「張成子空間」這三個基本概念。介紹了「零空間」和「列空間」的基本概念後,還要學會在這兩個集合上做以下運算:

  1. 給定一個向量,求該向量是否在「零空間」或「列空間」中;
  2. 求「零空間」或「列空間」的任一向量;
  3. 求「零空間」和「列空間」的基(前提:子空間和列空間都是某一向量空間的子空間);
  4. 求「零空間」和「列空間」的秩;
  5. 比較「零空間」和「列空間」;
  6. 尋找「零空間」和「列空間」的聯繫。

3-6這四個問題放到下篇文章介紹基、緯度、和秩的時候再作為例子解釋。

向量空間

向量空間是线性代數中一個抽象的概念,其常見特例為 Rn\mathbb{R}^n 。其實,向量空間也正是從 Rn\mathbb{R}^n 中抽象出來的。定義向量空間的方法是公理化的,即有一些性質是我們共同假定的事實,不消證明,如同條件一般。

向量空間是一個非空集合 VV ,於其上定義兩個運算,並要求其滿足八個公理:

運算:

  • 向量加法: 對於向量空間 v\vec{v} 中的任意兩個向量 u\vec{u}v\vec{v} , 定義向量加法為 u+v\vec{u}+\vec{v}(向量對應項相加),並且此結果也在向量空間 v\vec{v} 中( u,vv,u+vv\forall \vec{u}, \vec{v} \in \vec{v}, \vec{u}+\vec{v} \in \vec{v},向量空間對於加發自封);

  • 標量乘法: 對於向量空間 v\vec{v} 中的任意向量 u\vec{u},和任意標量 cc [1], 標量乘法定義為 cuc\vec{u}(向量每一項都乘以 cc),並且此結果也在向量空間 v\vec{v} 中( uv,cR,cuv\forall \vec{u}\in \vec{v}, c \in \mathbb{R}, c\vec{u} \in \vec{v},向量空間對於標量乘法自封)

公理:

對於 v,u,wV\forall \vec{v},\vec{u}, \vec{w} \in Vc,dR\forall c,d \in \mathbb{R}

  1. 交換律:u+v=v+u\vec{u}+\vec{v}=\vec{v}+\vec{u}
  2. 結合律:(u+v)+w=u+(v+w)(\vec{u}+\vec{v})+w = \vec{u}+(\vec{v}+w)
  3. 零向量(向量加法身分):v\vec{v} 中有一向量 0\vec{0}, 使得 u+0=u\vec{u}+\vec{0}=\vec{u}
  4. 負向量:對於 u\vec{u}uV\exists -\vec{u} \in V, 使得 u+(u)=0\vec{u}+(-\vec{u})=\vec{0}
  5. 標量和分配律:(c+d)u=cu+du(c+d)\vec{u}=c\vec{u}+d{\vec{u}}
  6. 向量和分配律:c(u+v)=cu+cvc(\vec{u}+\vec{v})=c\vec{u}+c\vec{v}
  7. 標量乘法交換率:c(du)=(cd)uc(d\vec{u})=(cd)\vec{u}
  8. 標量乘法身分:1u=u1\vec{u}=\vec{u}

於是可以證明以下事實:

  • 0u=00\vec{u}=\vec{0}
    proof:0u=(0+0)u=0u+0u(標量和分配律)0u+(0u)=0(負向量定義)=0u+0u+(0u)(帶入上上式)=0u+0(負向量定義)=0u(零向量定義)\begin{aligned} &proof:\\ &0\vec{u}=(0+0)\vec{u}=0\vec{u}+0\vec{u}\text{\footnotesize \textcolor{gray}{(標量和分配律)}}\\ &0\vec{u}+(-0\vec{u})=\vec{0}\text{\footnotesize \textcolor{gray}{(負向量定義)}}\\ =&0\vec{u}+0\vec{u}+(-0\vec{u})\text{\footnotesize \textcolor{gray}{(帶入上上式)}}\\ =&0\vec{u}+\vec{0} \text{\footnotesize \textcolor{gray}{(負向量定義)}}\\ =&0\vec{u}\text{\footnotesize \textcolor{gray}{(零向量定義)}} \end{aligned}

  • c0=0c\vec{0}=\vec{0}
    proof:c0=c(0+0)=c0+c0c0+(c0)=0=c0+c0+(c0)=c0+0=c0\begin{aligned} &proof:\\ &c\vec{0}=c(\vec{0}+\vec{0})=c\vec{0}+c\vec{0} \\ &c\vec{0}+(-c\vec{0})=\vec{0} \\ =&c\vec{0}+c\vec{0}+(-c\vec{0}) \\ =&c\vec{0}+\vec{0} \\ =&c\vec{0} \end{aligned}

  • u=(1)u-\vec{u}=(-1)\vec{u}
    proof:0=0u=[(1)+(1)]u把 0 拆分成正負 1)=1u+(1)u(標量和分配律)=u+(1)u(標量乘法身分)\begin{aligned} &proof:&\\ &\vec{0}=0\vec{u}=\left[(1)+(-1)\right]\vec{u} \text{\footnotesize(\textcolor{gray}{把 0 拆分成正負 1)}}\\ & =1\vec{u}+(-1)\vec{u}\text{\footnotesize \textcolor{gray}{(標量和分配律)}}\\ & =\vec{u}+(-1)\vec{u}\text{\footnotesize \textcolor{gray}{(標量乘法身分)}} \end{aligned}

    0+(u)=u+(1)u+(u)u=0+(1)uu=(1)u\begin{aligned} \vec{0}+(-\vec{u})&=\vec{u}+(-1)\vec{u}+(-\vec{u}) \\ -\vec{u}&=\vec{0}+(-1)\vec{u} \\ -\vec{u}&=(-1)\vec{u} \end{aligned}

向量空間是我們討論問題的起點和前提,它告訴了我們我研究對象具有的一般特性是什麼。這樣的定義方法和研究方式稱為「公理化」,在概率論中有更深的體現,在此不贅述。

子空間

定義了向量空間後,我們會思考,一個向量中間的子集,也可能是一個向量空間嗎?通常我們只檢查下面三條性質,其他的自動滿足:

對於一個向量空間 VV, 其子集 HH 若滿足

  1. 0H\vec{0} \in H
  2. u,vH,u+uH\forall \vec{u}, \vec{v} \in H, \vec{u}+\vec{u} \in H (子空間對於向量加法自封)
  3. uH,cF,cuH\forall \vec{u} \in H, \forall c \in F, c\vec{u} \in H(子空間對於標量乘法自封)

則該子集 HH 是向量空間 VV 的一個子空間

注意R2\mathbb{R}^2 不是 R3\mathbb{R}^3 的子空間, R2\mathbb{R}^2 甚至都不是 R3\mathbb{R}^3 的子集。形如 R2\mathbb{R}^2R3\mathbb{R}^3 的子空間為:

H={[st0]:s,tR}H=\left \{ \begin{bmatrix} s\\ t\\ 0 \end{bmatrix}: s, t \in \mathbb{R}\right \}

描述一個集合的方法

有兩種方式可以描述一個集合,一種是形式化描述,另一種是特徵化描述

  1. H={[a2a]:aR}H=\left \{ \begin{bmatrix} a\\ 2a \end{bmatrix} : a \in \mathbb{R} \right \} ,左側 [a2a]\begin{bmatrix} a\\ 2a \end{bmatrix} 為集合的形式,中間 :: 為分隔符,右側 aRa \in \mathbb{R} 表示變量的定義。
  2. K={[abc]R3:a+b>c}K=\left \{ \begin{bmatrix} a\\ b \\ c \end{bmatrix} \in \mathbb{R}^3 : a+b>c \right \} ,左側 [abc]R3\begin{bmatrix} a\\ b \\ c \end{bmatrix} \in \mathbb{R}^3 表示一個一般化的向量,中間 :: 為分隔符,右側 a+b>ca+b>c 表示該集合的特性,即需要遵守的規則。

讀者可自己證明, HHR2\mathbb{R}^2 的一個子空間, KK 不是 R3\mathbb{R}^3 的子空間。

等介紹完零空間和列空間,再來總結這兩種表示集合方法。

張成子空間

對於 pp 個向量 v1,v2,,vpV\vec{v_1}, \vec{v_2}, \cdots, \vec{v_p} \in V , 它的一個線性組合為 c1v1+c2v2++cpvpc_1\vec{v_1}+c_2\vec{v_2}+\cdots+c_p\vec{v_p},其中 c1,c2,,cpFc_1,c_2,\cdots,c_p \in \mathbb{F}張成子空間 (生成子空間) 被定義為這 pp 個向量所有的線性組合所組成的集合,即:

Span{v1,v2,,vp}={c1v1+c2v2++cpvp:c1,c2,,cpF}\text{Span}\left \{\vec{v_1}, \vec{v_2}, \cdots, \vec{v_p}\right \} = \left \{c_1\vec{v_1}+c_2\vec{v_2}+\cdots+c_p\vec{v_p}\,\,: c_1,c_2,\cdots,c_p \in \mathbb{F}\right \}

張成子空間是 VV 的子空間嗎?我們通過子空間的定義來證明:

  1. 零向量: 取 c1,c2,,cp=0,0,,0c_1,c_2,\cdots,c_p=0,0,\cdots,0
  2. 向量加法自封:
    proof:u,wHu=c1v1+c2v2++cpvp,c1,c2,,cpFw=d1v1+d2v2++dpvp,d1,d2,,dpFu+w=(c1+d1)v1++(cp+dp)vp\begin{aligned} &proof:\\ &\forall \vec{u}, \vec{w} \in H \\ &\vec{u} = c_1\vec{v_1}+c_2\vec{v_2}+\cdots+c_p\vec{v_p}, \,\, \exists c_1,c_2,\cdots,c_p \in \mathbb{F} \\ &\vec{w} = d_1\vec{v_1}+d_2\vec{v_2}+\cdots+d_p\vec{v_p}, \,\, \exists d_1,d_2,\cdots,d_p \in \mathbb{F} \\ &\vec{u}+\vec{w} = (c_1+d_1)\vec{v_1} + \cdots + (c_p+d_p)\vec{v_p} \end{aligned}
    c1+d1cp+dpc_1+d_1 \cdots c_p+d_pe1epe_1 \cdots e_p,故e1epFe_1 \cdots e_p \in \mathbb{F}
  3. 數量乘法自封:和2同理,懶得證明了

零空間

零空間是一個齊次線性方程組的解集。具體來說,對於一個矩陣 Am×nA_{m\times n} ,還有 xRn\vec{x} \in \mathbb{R}^n ,把滿足 Ax=0A\vec{x}=\vec{0}x\vec{x} 所組成的集合稱為矩陣 AA零空間。即:

NulA={xRn:Ax=0}\text{Nul}\, A=\left \{ \vec{x} \in \mathbb{R}^n : A\vec{x}=\vec{0} \right \}

如果用一個更加動態的視角來看,零空間描述了一個映射,它把 Rn\mathbb{R}^n 中一些 x\vec{x} ,通過 AA 這個線性變換,變換到了 Rm\mathbb{R}^m 上的零向量上,零空间是这个线性变换的原像。即:

T:RnRmxAx=0\begin{aligned} T:\mathbb{R}^n & \rightarrow \mathbb{R}^m \\ \vec{x} &\mapsto A\vec{x} = \vec{0} \end{aligned}

現在我們要證明的是,矩陣 Am×nA_{m\times n} 的零空間 NulA\text{Nul}\, ARn\mathbb{R}^n 的一個子空間,依然要從定義入手。

  1. 零向量:判斷一個向量 u\vec{u} 是否在零空間,根據其定義,只消計算 AxA\vec{x} 是否為 0\vec{0} ,顯然 A0=0A\vec{0}=\vec{0}

  2. 向量加法:若 u,vNulA\forall \vec{u}, \vec{v} \in \text{Nul}\, A ,有 u+vNulA\vec{u}+\vec{v} \in \text{Nul}\, A 嗎?
    proof:根據定義有:u,vNulAAu=0Av=0\begin{aligned} &proof:\\ &\text{\footnotesize根據定義有:}\\ &\forall \vec{u}, \vec{v} \in \text{Nul}\, A \\ &A\vec{u} = \vec{0} \\ &A\vec{v} = \vec{0} \end{aligned}

    對於 (u+v)(\vec{u}+\vec{v}) 而言,現檢驗 A(u+v)A(\vec{u}+\vec{v}) 是否為零向量。

    A(u+v)=Au+Av=0+0=0\begin{aligned} & A(\vec{u}+\vec{v}) \\ &=A\vec{u}+A\vec{v} \\ &=\vec{0}+\vec{0}\\ &=\vec{0} \end{aligned}

  3. 標量乘法:若 uNulA,cR\forall \vec{u} \in \text{Nul}\, A, \forall c \in \mathbb{R} ,有 cuNulAc\vec{u} \in \text{Nul}\, A 嗎?
    proof:根據定義有:uNulAAu=0\begin{aligned} &proof:\\ &\text{\footnotesize 根據定義有:}\\ &\forall \vec{u} \in \text{Nul}\, A \\ &A\vec{u} = \vec{0} \end{aligned}

    對於 (cu)(c\vec{u}) 而言,現檢驗 A(cu)A(c\vec{u}) 是否為零向量。

    A(cu)=c(Au)=c0=0\begin{aligned} & A(c\vec{u}) \\ &=c(A\vec{u}) \\ &=c\vec{0}\\ &=\vec{0} \end{aligned}

在證明零空間是一個子空間時,知:判斷一個向量是否在某一矩陣的零空間中,只消看該矩陣乘以此向量是否為一個零向量,這是一件簡單的事情,因為零空間的定義是性質性描述。那麼,如何用形式化描述表示零空間呢?很顯然,我們需要解 Ax=0A\vec{x} = \vec{0}

列空間

把矩陣 Am×nA_{m\times n} 寫成列向量的形式 [a1,a2,,an]\begin{bmatrix} \vec{a}_1, & \vec{a}_2, & \cdots, & \vec{a}_n \end{bmatrix}列空間被定義為這 nn 個向量所張成的子空間,即:

ColA=Span{a1,a2,,an}\text{Col}\, A = \text{Span}\left \{ \vec{a}_1, \vec{a}_2, \cdots, \vec{a}_n \right \}

列空间构造了一个從 Rn\mathbb{R}^nRm\mathbb{R}^m 的映射,即

T:RnRmxAx\begin{aligned} T:\mathbb{R}^n &\rightarrow \mathbb{R}^m \\ \vec{x} &\mapsto A\vec{x} \end{aligned}

由於每一個 aiRm\vec{a_i} \in \mathbb{R}^m ,由張成子空間的性質可知,ColA\text{Col}\, ARm\mathbb{R}^m 的一個子空間。

補充

以下內容皆為補充,可能寫的不是很詳細,例子也不是很充分,作為正文沒有提到的重要線性代數知識的補充。

複數

我們已熟悉集合 R\mathbb{R} 上定義的實數。數學家發明了複數用以表徵負數的平方根,這個想法把 1-1 的平方根記為 ii ,並且它滿足基本的四則運算。具體來說,複數是有序對 (a,b)(a,b) ,其中 a,cRa,c \in \mathbb{R} , 我們將其記為 a+bia+bi ,所有複數組成的集合記為 C\mathbb{C}

C={a+bi:a,bR}\mathbb{C} = \left\{ a+bi:a,b\in\mathbb{R} \right\}

在此基礎上定義複數的兩個基本運算:對於 a,b,c,dR\forall a,b,c,d \in \mathbb{R}

  • 複數加法:(a+bi)+(c+di)=(a+b)+(c+d)i(a+bi)+(c+di)=(a+b)+(c+d)i
  • 複數乘法:(a+bi)(c+di)=(acbd)+(ad+bc)i(a+bi)(c+di)=(ac-bd)+(ad+bc)i

可以驗證複數也滿足交換律、結合律、加法的身份、負複數、乘法的身份、分配律的性質,這些性質都繼承自實數。

列表

假設 nn 為一非負整數,長度為 nn列表定義為一群 nn 個有序元素,用逗號將他們分隔,並用括弧將他們組成一個整體,形如:

(x1,,xn)(x_1, \cdots, x_n)

兩列表相等,當且僅當這兩個列表的長度相等,並且在同一索引的元素相等。

經常把長度為 nn 的列表稱為 n\boldsymbol{n} 元組

列表和集合主要有兩個差別:在列表中,順序和重複元素都起到作用,但是在集合中順序和重複元素都不起作用,所以:

  • {3,5}={5,3}={3,5,5}\left\{3,5\right\}=\left\{5,3\right\}=\left\{3,5,5\right\}
  • (3,5)(5,3,5)(3,5)\left( 3,5 \right) \ne \left( 5,3,5 \right) \ne \left( 3,5 \right)

向量空間加法和標量負向量的唯一性

假設向量空間 VV 上有兩個零向量,分別為 0\vec{0}0\vec{0}^\prime ,現證明 0=0\vec{0} = \vec{0}^\prime

PROOF

0=0+0=0+0=0\vec{0}^\prime = \vec{0}^\prime + \vec{0} = \vec{0} + \vec{0}^\prime = \vec{0}

假設向量空間 VV 上有任意向量 w\vec{w} ,它的負向量有兩個,分別為 v\vec{v}v\vec{v}^\prime, 現證明 v=v\vec{v}=\vec{v}^\prime

v=v+0=v+(w+v)=(v+w)+v=0+v=v+0=v\vec{v} = \vec{v} + \vec{0} = \vec{v} + (\vec{w}+\vec{v}^\prime) = (\vec{v} + \vec{w}) +\vec{v}^\prime = \vec{0} + \vec{v}^\prime = \vec{v}^\prime + \vec{0} = \vec{v}^\prime

線性組合和線性表出

向量空間 VV 上的一個 nn 元組 (v1,,vn)(\vec{v_1}, \cdots, \vec{v_n})線性組合為:

a1v1++anvna_1\vec{v_1} + \cdots + a_n\vec{v_n}

其中 a1,,anFa_1, \cdots, a_n \in \mathbb{F}

w=a1v1++anvn\vec{w} = a_1\vec{v_1} + \cdots + a_n\vec{v_n} ,稱 w\vec{w} 可以由 v1,,vn\vec{v_1}, \cdots, \vec{v_n} 線性表出

線性無關

向量空間 VV 上的一個 nn 元組 (v1,,vn)(\vec{v_1}, \cdots, \vec{v_n}) 線性無關,當且僅當 a1v1++anvn=0a_1\vec{v_1} + \cdots + a_n\vec{v_n}=\vec{0} 沒有非零解。規定空元組是線性無關的。

線性相關

向量空間 VV 上的一個 nn 元組 (v1,,vn)(\vec{v_1}, \cdots, \vec{v_n}) 不是線性無關時,它們線性無相關。即, a1v1++anvn=0a_1\vec{v_1} + \cdots + a_n\vec{v_n}=\vec{0} 有非零解。

線性相關有一引理:若 v1,,vn\vec{v_1}, \cdots, \vec{v_n} 線性相關,則 j{1,2,,n}\exists j \in \left\{1,2,\cdots,n\right\} (這 nn 個向量中存在一個向量)使得:

  1. vjSpan{v1,,vj1,vj+1,,vn}\vec{v_j} \in \text{Span}\left\{ v_1,\cdots, v_{j-1}, v_{j+1}, \cdots, v_n \right\} (該向量可以由其他向量線性表出)
  2. Span{v1,,vj1,vj+1,vn}=Span{v1,,vn}\text{Span}\left\{ v_1,\cdots, v_{j-1}, v_{j+1} \cdots, v_n \right\}=\text{Span}\left\{ v_1,\cdots, v_n \right\} (去掉該向量後,剩餘 n1n-1 個向量仍能張成員來 nn 個向量張成的子空間)

  1. 一般來說 VV 是實屬域上的向量空間,所以我們也默認 cRc \in \mathbb{R} ;但是對於 cCc \in \mathbb{C} ,也可以類似地定義標量乘法,並且我們將討論到的定理也適用於複數域。我將直接假設標量都來自於實屬域或者複數域,記為 F\mathbb{F}RC\mathbb{R} 和 \mathbb{C} 都是的例子), VV 也是 F\mathbb{F} 上的向量空間。 ↩︎