高等代數筆記整理(七)

高等代數筆記整理(七)

來自專欄我的數學臆想15 人贊了文章

這篇開始,我們來探討線性映射。

這就不禁要問三個問題:

啥叫線性映射?

為什麼要研究線性映射?

該怎麼樣研究線性映射?

回答了這三個問題,我們才能算是初步了解了它。

我們接下來的內容就會圍繞著這三個問題來展開。

目錄

  • 引語
  • 線性映射
  • 矩陣及其運算
  • 線性映射在基下的矩陣

引語

我們說,研究線性映射是探討線性空間結構的第三種方式。

為什麼這麼說?

從後面你就會看到,線性映射實際上是兩個線性空間之間點的運動軌道,即在兩個線性空間中架起了一座橋,這當然有助於我們更加了解線性空間。

另外,線性映射作為一個獨立的個體也是很有用的,相信你已經發現了,映射和集合其實是數學中很深刻的概念,大部分數學大廈都要搭建在這兩個基石之上(或許限於個人水平有所言重了,但是確實十分重要),而線性映射又是一種相對簡單的映射,所以從他開始研究映射再好不過。

除此之外,這也為我們今後研究非線性的問題提供了一種思路(或者說一條捷徑),即把困難的我們所不熟悉的非線性問題轉化為我們所熟悉的線性問題來解決(在微積分中,微分就是一個很好的例子)。

或許是這也是現代教育把線性代數作為代數的第一門課也是必修課的原因之一吧。

所以,我們甚至可以換一個角度,說高等代數(或者是線性代數)整門課是以線性映射(而不是線性空間)為核心進行展開的也不為過,實際上,這正是另一種解讀這門課的思路。

那麼我們就開始吧。

線性映射(Linear Map)

我們都知道映射的概念,但是啥叫線性映射?

我們給出定義:

Def:設 V,V 是域 F 上的兩個線性空間,如果映射 	extbf{A}:V 
ightarrow V 滿足:

a. 	extbf{A}(alpha+eta)=	extbf{A}({alpha})+	extbf{A}({eta}),forall alpha,eta in V

b. 	extbf{A}(kalpha)=k	extbf{A}({alpha}),forall alphain V,k in F

那麼就稱 	extbf{A} 是從 VV 的一個線性映射,有時 	extbf{A}(alpha) 也簡寫為 	extbf{A}alpha

我們嘗試來描述這個線性映射。

那麼我們如何來刻畫一個線性映射呢?

一個可以想到的方法是,把定義域中所有向量的像都寫出來,這就好比完全地求出了這個對應法則,但是在大部分情況下這顯然是行不通的,因為一般線性空間都具有無數多個向量。

那麼我們就想,是否可以只通過求出有限多個向量的像或是其他的東西就能得到定義域中任意向量的像,我們作出以下嘗試:

任取 V 中的一個向量 alphaalpha_1,alpha_2,cdots,alpha_nV 的一個基。

那麼就有 alpha=x_1alpha_1+x_2alpha_2+cdots+x_nalpha_n ,於是

egin{align} 	extbf{A}(alpha)&=	extbf{A}(x_1alpha_1+x_2alpha_2+cdots+x_nalpha_n) \ &=x_1	extbf{A}alpha_1+x_2	extbf{A}alpha_2+cdots+x_n	extbf{A}alpha_n end{align}

由於坐標不依賴於線性映射(在這裡我們就把 (x_1,x_2,cdots,x_n)^T 稱為向量 alpha 在基 alpha_1,alpha_2,cdots,alpha_n 下的坐標),所以這就相當於是說,只要你選定了 V 中的一個基,並求出這個基中全部向量在線性映射下對應的像,就可以寫出 V 中任意向量的像了。

我們再設 eta_1,eta_2,cdots,eta_mV 的一個基,因為 	extbf A eta in V,forall eta in V (因為 V 是陪域)所以 	extbf Aalpha_1,	extbf Aalpha_2,cdots,	extbf Aalpha_n in V ,這就有

egin{array}{lr} 	extbf Aalpha_1=a_{11}eta_1+a_{21}eta_2+cdots+a_{m1}eta_m \ 	extbf Aalpha_2=a_{12}eta_1+a_{22}eta_2+cdots+a_{m2}eta_m \  cdots qquad cdots qquad  cdots quad   , cdots   quad cdots \ 	extbf Aalpha_n=a_{1n}eta_1+a_{2n}eta_2+cdots+a_{mn}eta_m end{array}

這就是說,只需要 m 	imes n 個數就能完全刻畫出這個線性映射了,我們嘗試通過一個簡單且具體的方式將這 m 	imes n 個數排列出來,這就需要引入矩陣了。

(其實在解線性方程組那裡我們已經引入過一次矩陣了,這次是從一個完全不同的角度來引入)

矩陣及其運算(Matrix)

我們先來給出矩陣的定義。

Def:由 m × n 個數aij排成的m行n列的數表稱為m行n列的矩陣,簡稱m × n矩陣。記作:

A=left( egin{array}{lr} a_{11} quad a_{12} quad cdots quad a_{1n}\ a_{21} quad a_{22} quad cdots quad a_{2n}\ cdots quad cdots quad , cdots quad cdots\ a_{m1} quad a_{m2}   cdots quad a_{mn} end{array} 
ight)

這m×n 個數稱為矩陣A的元素,簡稱為元,數aij位於矩陣A的第i行第j列,稱為矩陣A的(i,j)元,以數 (a_{ij}) 為(i,j)元的矩陣可記為 (a_{ij})(a_{ij})_{m 	imes n} ,m×n矩陣A也記作 A_{mn}

兩個矩陣相等的定義是兩矩陣對應的每個元素都相等。

元素是實數的矩陣稱為實矩陣,元素是複數的矩陣稱為復矩陣。而行數與列數都等於n的矩陣稱為n階矩陣或n階方陣。

下面定義一些它的運算(設 A=(a_{ij})_{m 	imes n},B=(b_{ij})_{m 	imes n}

加法: A+B=(a_{ij})+(b_{ij}) 	riangleq (a_{ij}+b_{ij}) ,即

left( egin{array}{lr} a_{11} quad a_{12} quad cdots quad a_{1n}\ a_{21} quad a_{22} quad cdots quad a_{2n}\ cdots quad cdots quad , cdots quad cdots\ a_{m1} quad a_{m2}   cdots quad a_{mn} end{array} 
ight) + left( egin{array}{lr} b_{11} quad b_{12} quad cdots quad b_{1n}\ b_{21} quad b_{22} quad cdots quad b_{2n}\ cdots quad cdots quad , cdots quad cdots\ b_{m1} quad b_{m2}   cdots quad b_{mn} end{array} 
ight) 	riangleq egin{align} left( egin{array}{c} &a_{11}+b_{11} quad &a_{12}+b_{12} quad &cdots quad &a_{1n}+b_{1n}\ &a_{21}+b{21} quad &a_{22}+b_{22} quad &cdots quad &a_{2n}+b_{2n}\ &cdots quad &cdots quad , &cdots quad &cdots\ &a_{m1}+b_{m1} quad &a_{m2}+b_{m2}   &cdots quad &a_{mn}+b_{mn} end{array} 
ight) end{align}

標量乘法: kA=k(a_{ij})	riangleq(ka_{ij}) ,即

kleft( egin{array}{lr} a_{11} quad a_{12} quad cdots quad a_{1n}\ a_{21} quad a_{22} quad cdots quad a_{2n}\ cdots quad cdots quad , cdots quad cdots\ a_{m1} quad a_{m2}   cdots quad a_{mn} end{array} 
ight) 	riangleq left( egin{array}{lr} ka_{11} quad ka_{12} quad cdots quad ka_{1n}\ ka_{21} quad ka_{22} quad cdots quad ka_{2n}\  cdots quad  cdots quad  cdots quad cdots\ ka_{m1} quad ka_{m2}   cdots quad ka_{mn} end{array} 
ight),forall k in F

【注】由加法和標量乘法運算就可以知道,實際上所有同型的矩陣(也就是兩兩矩陣行列數相同)組成的集合也是一個線性空間,只需要根據定義就能驗證了,我們把這個證明留給大家(實際上是懶……),在這裡我們默認它在域F上取值。

容易看出,所有 m 	imes n 型矩陣組成的線性空間的維數為 mn ,且它的一個簡單的基是:

E_{11}= egin{pmatrix} 1 &0 &cdots &0 \ 0 &0 &cdots &0 \ vdots &vdots & &vdots \ 0 &0 &cdots &0 end{pmatrix}, E_{12}= egin{pmatrix} 0 &1 &cdots &0 \ 0 &0 &cdots &0 \ vdots &vdots & &vdots \ 0 &0 &cdots &0 end{pmatrix}, cdots, E_{mn}= egin{pmatrix} 0 &0 &cdots &0 \ 0 &0 &cdots &0 \ vdots &vdots & &vdots \ 0 &0 &cdots &1 end{pmatrix}

我們把這mn個矩陣(即只有一個元素為一,其餘元素均為零的矩陣)稱為基本矩陣(Fundamental matrix)。

有點跑偏了……

我們把鏡頭拉回來,以上都是一些簡單運算的定義,下面我們引入矩陣的乘法運算(之後你會看到為什麼會這樣定義)

Def:設 A=(a_{ij})_{s 	imes n},B=(b_{ij})_{n 	imes m} ,令 C=(c_{ij})_{s 	imes m} ,其中

(c_{ij})=a_{i1}b_{1j}+a_{i2}b_{2j}+cdots+a_{in}b_{nj}=sum_{k=1}^n a_{ik}b_{kj},i=1,2,cdots,s;j=1,2,cdots,m

則矩陣 C 稱為矩陣 AB乘積,記作 C=AB

【注】(丘維聲《高等代數》P143)

1.只有做矩陣的列數與右矩陣的行數相同兩個矩陣才能相乘。

2.乘積矩陣的 (i;j) 元等於左矩陣的第 i 行與右矩陣的第 j 列的對應元素的乘積之和。

3.乘積矩陣的行數等於左矩陣的行數,乘積矩陣的列數等於右矩陣的列數。

我們來舉個例子

【例題】設 A=egin{pmatrix} 1 &-2 \ 0 &3 \ -1 &2 \ end{pmatrix}B=egin{pmatrix} 4 &5 \ 6 &7 \ end{pmatrix} ,求 AB

【分析】

egin{align} AB&=egin{pmatrix} 1 &-2 \ 0 &3 \ -1 &2 \ end{pmatrix} egin{pmatrix} 4 &5 \ 6 &7 \ end{pmatrix} \ &= egin{pmatrix} 1	imes4+(-2)	imes6 &1	imes5+(-2)	imes7 \ 0	imes4+3	imes6 &0	imes5+3	imes7 \ (-1)	imes4+2	imes6 &(-1)	imes5+2	imes7 end{pmatrix} \ &=egin{pmatrix} -8 &-9 \ 18 &21 \ 8 &9 \ end{pmatrix} end{align}

為了以後的方便,我們給出矩陣乘法的幾個性質。

Prop

1.結合律:設 A=(a_{ij})_{s 	imes n},B=(b_{ij})_{n 	imes m},C=(c_{ij})_{m 	imes r} ,則 (AB)C=A(BC)

proof:顯然, (AB)C,A(BC) 都是 s 	imes r 型矩陣,且

[(AB)C](i;j)=sum_{l=1}^m[(AB)(i;l)]c_{lj}=sum_{l=1}^m(sum_{k=1}^na_{ik}b_{kl})c_{li}=sum_{l=1}^m(sum_{k=1}^na_{ik}b_{kl}c_{li}) \ [A(BC)](i;j)=sum_{l=1}^ma_{ik}[(BC)(k;j)]=sum_{k=1}^na_{ik}(sum_{l=1}^nb_{kl}c_{lj})=sum_{k=1}^n(sum_{l=1}^ma_{ik}b_{kl}c_{lj})

於是 [(AB)C](i;j)=[A(BC)](i;j)(這裡用到一個小結論:連加具有交換律,即 sum_{i=1}^nsum_{j=1}^m=sum_{j=1}^msum_{i=1}^n ) ,即 (AB)C=A(BC)

2.分配律

左分配律: A(B+C)=AB+AC

右分配律: (A+B)C=AC+BC

這裡證明略去(運用定義展開即可證明)。

【注】矩陣的乘法不滿足交換律,首先 ABBA 不一定同時有存在,其次,就算 ABBA 存在了,交換律也是不成立的,我們舉出反例:

egin{pmatrix} 1 &1 \ 0 &0 end{pmatrix} egin{pmatrix} 2 &0 \ 1 &1 end{pmatrix} = egin{pmatrix} 3 &1 \ 0 &0 end{pmatrix} ,而 egin{pmatrix} 2 &0 \ 1 &1 end{pmatrix} egin{pmatrix} 1 &1 \ 0 &0 end{pmatrix} = egin{pmatrix} 2 &2 \ 1 &1 end{pmatrix}

或者 egin{pmatrix} 1 \ 2 end{pmatrix} egin{pmatrix} 1 &1 \ end{pmatrix} = egin{pmatrix} 1 &1 \ 2 &2 end{pmatrix} ,而 egin{pmatrix} 1 &1 \ end{pmatrix} egin{pmatrix} 1\ 2 end{pmatrix} =(3)=3

【注】通常,只含一個標量的向量 (a) 我們也直接記作a。

如果對於兩個矩陣 A,B ,有 AB=BA ,那麼我們就稱 A,B 是可交換的。

由於交換律是一個很有用的性質,在矩陣的乘法中又不常見,我們就來找一找都有哪些矩陣之間是可交換的以及可交換的矩陣之間具有什麼性質。

首先,很容易可以知道兩個矩陣可交換必須要兩個矩陣都是同階的方陣。(由矩陣乘積的定義)

所以我們可以把討論範圍縮小到方陣上來(以後除特別指出,A均默認為n階方陣)。

我們先來定義幾個特殊的方陣。

單位矩陣(Unit matrix)

Def:如果對於任意n階矩陣A,都有 AI=IA=A ,那麼就稱I是n階單位矩陣。

【注】顯然,n階單位陣是所有n階矩陣組成集合的乘法幺元。

通過定義我們可以求出,n階單位矩陣

I_n= egin{pmatrix} 1 &0 &cdots &0 \ 0 &1 &cdots &0 \ vdots &vdots & &vdots \ 0 &0 &cdots &1 end{pmatrix}

即主對角線上元素全為1,其餘元素全為0的矩陣。

顯然,單位矩陣與任意n階矩陣A可交換(由定義),但是這是trivial的,於是我們將它變化一下。

標量矩陣(Scalar matrix)

Def:主對角線上元素(以後稱為主對角元)是同一個標量k,其餘元素全為0的n階矩陣稱為標量矩陣,可以記為kI,容易看出

kI= egin{pmatrix} k &0 &cdots &0 \ 0 &k &cdots &0 \ vdots &vdots & &vdots \ 0 &0 &cdots &k end{pmatrix}

同樣,可以證明標量矩陣也與任意n階矩陣可交換。

再把條件放寬一點,我們就得到了對角矩陣。

對角矩陣(Diagonal matrix)

Def:除了主對角元外,其餘元素全為零的矩陣稱為對角矩陣。

Lambda= egin{pmatrix} lambda_1 &0 &cdots &0 \ 0 &lambda_2 &cdots &0 \ vdots &vdots & &vdots \ 0 &0 &cdots &lambda_n end{pmatrix} ,有時也記作 diagleft{ lambda_1,lambda_2,cdots,lambda_n 
ight}

當然了,對角矩陣並不是和任意矩陣都可交換,但是任意兩對角矩陣可交換。

最後,也是最重要的,n階矩陣A與自身可交換。

下面來我們列出一些矩陣可交換的性質。

Prop(設 A,B 可交換)

1. (AB)^2=A^2B^2

proof: (AB)^2=ABAB=A(BA)B=A(AB)B=(AA)(BB)=A^2B^2

Corollary: (AB)^k=A^kB^k (由數學歸納法證明)

【注】(我們把k個矩陣A相乘簡記為 A^k

2. (A+B)^2=A^2+2AB+B^2

Corollary: (A+B)^k 滿足二項式定理(由數學歸納法證明)。

3. (A+B)(A-B)=A^2-B^2

注意,不可交換的矩陣沒有以上性質。

4.對於任意由矩陣生成的多項式 f(A),g(A),f(A)g(A)=g(A)f(A)

這裡由矩陣生成的多項式是指形如 a_mA^m+a_{m-1}A^{m-1}+cdots+a_1A+a_0 的式子。

proof:因為A與自身可交換

好,關於矩陣的東西我們先將到這裡,下面我們繼續探討線性映射的內容。

線性映射在基下的矩陣

根據本篇第一部分的內容,我們有

egin{align} 	extbf{A}(alpha)&=	extbf{A}(x_1alpha_1+x_2alpha_2+cdots+x_nalpha_n) \ &=x_1	extbf{A}alpha_1+x_2	extbf{A}alpha_2+cdots+x_n	extbf{A}alpha_n \ &=(	extbf Aalpha_1,	extbf Aalpha_2,cdots,	extbf Aalpha_n) egin{pmatrix} x_1 \ x_2 \ vdots \ x_n end{pmatrix} end{align}

又由

egin{array}{lr} 	extbf Aalpha_1=a_{11}eta_1+a_{21}eta_2+cdots+a_{m1}eta_m \ 	extbf Aalpha_2=a_{12}eta_1+a_{22}eta_2+cdots+a_{m2}eta_m \  cdots qquad cdots qquad  cdots quad   , cdots   quad cdots \ 	extbf Aalpha_n=a_{1n}eta_1+a_{2n}eta_2+cdots+a_{mn}eta_m end{array}

於是就有

Aalpha= (eta_1,eta_2,cdots,eta_m)left( egin{array}{lr} a_{11} quad a_{12} quad cdots quad a_{1n}\ a_{21} quad a_{22} quad cdots quad a_{2n}\ cdots quad cdots quad , cdots quad cdots\ a_{m1} quad a_{m2}   cdots quad a_{mn} end{array} 
ight) egin{pmatrix} x_1 \ x_2 \ vdots \ x_n end{pmatrix}

我們把中間的矩陣記成A, alpha 在基 alpha_,alpha_,cdots,alpha_n 下的坐標 egin{pmatrix} x_1 \ x_2 \ vdots \ x_n end{pmatrix} 記作X,於是就有

	extbf Aalpha=(eta_1,eta_2,cdots,eta_m)AX ,我們把這裡的矩陣A稱為線性映射 	extbf A 在V的基 alpha_1,alpha_2,cdots_,alpha_n 與V的基 eta_1,eta_2,cdots_,eta_m 下的矩陣。

它的意義在於,對於一個線性映射而言,只要定義域和陪域分別確定了一個基,那麼這個線性映射就能完全由一個矩陣刻畫了,換句話說,在確定了基的情況下, 	extbf A 與A就是同一個東西,即 	extbf A 與A是「等價「的!

它的意義在於,我們通過這個簡單的式子把一個抽象的線性映射轉化為了一個具體的矩陣,這樣來說,以後我們要討論線性映射的性質很大程度上就能轉化為討論矩陣的性質了。

那麼我們就會有如下兩個問題:

1.同一線性映射在不同基下的矩陣有什麼關係?

2.這種「等價性」的本質是什麼?

第一個問題是相當有用的,因為由於不同基下的矩陣不同,我們就不能很好的刻畫這個線性映射,只有找到不同基下矩陣之間那個本質性的聯繫,才算真正抓住了這個線性映射的本質。

第二個問題更具有開拓性,因為搞懂了這個問題,我們或許能把這種思想推廣到很多類似的問題上去,那麼就能把以往的那些看起來複雜抽象的問題通過這種」等價「的形式轉化為簡單具體的問題,這無疑是powerful的。

這將是我們接下來需要討論的問題。

小結

本篇筆記我們從線性映射的定義入手,想要找到一種具象的方式來描述一個線性映射,進而我們引入了矩陣並定義了它幾個的運算。

後來又給出了幾種可交換的矩陣並給出矩陣可交換的一些性質,最後把主線拉了回來,發現在確定了定義域與陪域基的情況下,可以通過一個矩陣來完全代表一個線性映射。

最後我們提出了兩個問題,即」同一線性映射在不同基下的矩陣有什麼關係?「和」這種『等價性』的本質是什麼?「並把它作為之後將要探討的主題。

OK,今天的內容就講到這裡,碼字不易,歡迎各位看官點贊收藏感謝打賞支持,小生在此拜過各位啦~~(吐槽:真的不想打這些矩陣啊啊啊!!)

任何筆記都具有著作權,未經同意不得剽竊或轉載。


推薦閱讀:

代數式求最值:尋找幾何意義
線性代數問題:當矩陣中每個列向量的和都為1時,一定有一個特徵值是1,這個怎麼推導啊?
1、奇異矩陣的感性理解

TAG:高等代數 | 線性代數 | 大學數學 |