文章首发于优快云,禁止转发!
文章目录
一、概述
高等代数是大学数学专业的重要基础课之一,是中学代数的继续和提高。它是由多项式论(或方程论)和线性代数两大部分组成。方程论是十九世纪初形成的代数的中心问题。它围绕着一个未知量的 n n n 次代数方程(1)的解法的研究形成了一整套理论。
x n + a 1 x n − 1 + ⋯ + a n − 1 x + a n = 0 ( 1 ) x^n+a_1x^{n-1}+\cdots+a_{n-1}x+a_n=0(1) xn+a1xn−1+⋯+an−1x+an=0(1)
这部分内容在中学代数课程里有多不少是讨论过的,例如,多项式的运算、多项式的因式分解、二次方程等等。
(博主:高中数学的大量内容是1600年左右发展的数学,如解析几何是笛卡尔利用代数和坐标系研究几何曲线产生的。目前高中学习的少量导数,来自于牛顿与莱布尼茨对于曲线的斜率与曲线下方的面积变化,即微积分的研究产生。高中数学题目中涉及到的对数、指数、三角函数等初等函数的运算,在伽利略时期即16世纪中叶到17世纪中叶就已经相当成熟了。一味追求于数学问题的求解,那是人类在数学历史的发展中长期探索一元多项式方程求解遗留的老旧思维定式。自1850年以后,人类对于数学问题的思考,逐渐从求解转向数学问题结构对于问题可解性、解的存在性、解的唯一性的影响,典型的问题如五次方程求解引出数学家对于群环域结构的发现。在博主眼中看来,会不会“高等代数、抽象代数”,属于个人数学水平的一个分水岭,至于后续的“矩阵论、群表示论、李群”则是更加遥远的未来了。目前博主还在数学系的高等代数课程后期内容上挣扎…… 2025.3.31 16:09)
现在来看,方程论不过是代数学的一个分支罢了。随着数学上的一些重大发现和其他学科对数学的要求,代数学的内容大大丰富起来。比如人们运算和它的对象的认识发展了,从而提出了研究抽象的“对象”和“运算”的要求,现代的代数转向到研究一些抽象代数体系的结构,使得代数有更广法的运用。
历史上,线性代数的第一个问题是关于解线性方程组(2)的问题。在中学代数课程里讨论过这个问题的最简单情形,对于任意 n n n 个未知量 m m m 个方程的情形,就需找出尽可能简单的数值解的方法,这在很多计算和研究中是常用到的。
{ a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 a 21 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 ⋮ a m 1 x 1 + a m 2 x 2 + ⋯ + a m n x n = b m ( 2 ) \mathsf{\left\{\begin{array}{c} a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=b_1\\ a_{21}x_1+a_{12}x_2+\cdots+a_{1n}x_n=b_1\\ \vdots\\ a_{m1}x_1+a_{m2}x_2+\cdots+a_{mn}x_n=b_m \end{array}\right.}(2) ⎩ ⎨ ⎧a11x1+a12x2+⋯+a1nxn=b1a21x1+a12x2+⋯+a1nxn=b1⋮am1x1+am2x2+⋯+amnxn=bm(2)
矩阵理论是线性代数中重要而且不可缺少的部分,它在提出和解决线性代数的问题中起着工具的作用。线性代数中很大篇幅是研究抽象的向量空间的结构和它的线性变换、欧氏空间的结构和它的线性变换、二次型等等。这些理论产生的源泉很多都来自数学分析和解析几何,反过来,应用线性代数中讨论的抽象理论,可以简化数学分析和解析几何中一些问题的讨论。线性代数已广泛地应用到其他学科(如在物理、力学、计算技术、编码等)领域中。 (博主:对于一个学习了工科的微积分和线性代数的学生而言,你必须尽量从实际的物理例子,这意味着你有力学、电磁学等物理知识储备,要是你将这两门工科学科升级到数学系的数学分析、高等代数那更好。 2025.3.31 16:18)
在大学里,这门课程的开设时间一般在一年级,有的学校安排在刚入学的第一学期,也有的学校安排在第二学期。前一种安排学起来比较吃力。最好在学完解析几何以后再学这门课。通过这门课的学习可以初步了解基本的、系统的代数知识和抽象的严格的代数方法,以加深对中学代数的理解,并为进一步学习打下基础。这门课的主要内容包括;
(一)基本概念:集合、映射、复数,数域等;
(二)多项式论:数域上一元多项式的因式分解理论、多项式的根;
(三)行列式;
(四)线性方程组理论
(五)矩阵;
(六)向量空间(线性空间)和它的线性变换
(七)欧几里得空间和它的线性变换;
(八)二次型和对称矩阵。
自学的读者只要具备中学代数和解析几何的基础就可以学习这门课。这门课在大学里总共的学时数大约是198,其中讲授153学时,习题课45学时。自学的读者可根据自己的情况安排进度,适当增加时间。
自学的读者首先要选择好自学课本,下面这几本教材可选做自学课本和参考书。
- 《高等代数》,北京大学数学力学系编,1978年,人民教育出版社出版。本书可作为自学课本。
- 《高等代数》,张禾瑞、郝鈵新编,1979年,人民教育出版社。本书也可选作课本。
- 《线性代数》,谢邦杰编,1978年,人民教育出版社。
- 《高等代数》,王萼芳编,1981年,上海科学技术出版社出版。
- 《近世代数》,吴品三编,1980年,人民教育出版社。
为了便于读者安排自学时间,我们按照前面列出的八个单元,提出一个自学时间安排表供大家参考,读者可以根据自己的实际水平安排进度。
二、基本概念
这个单元包括张禾瑞等所编《高等代数》的第一章或北大数力系所编书中的第六章第 1 节。所讲内容大部分是为以后的学习作准备的,也是代数的基本概念。主要介绍集合的有关知识、映射概念以及复数的建立等。这些内容不仅在代数学科中经常用到,而且在数学的各个分支中也是要常用的,因此,要学好数学也必须掌握这些基本知识。
集合论是数学的一个分支,内容很丰富。在这课程里只讲它的一点初步知识,比如集合的包含、子集合、集合的交和并等等,这些都很容易理解,远远没有进入集合论的领域。如果自学的读者有兴趣的话,可阅读集合论方面的专著。
关于映射概念,初学者总觉得很难理解。事实上,映射是中学代数课程中函数概念的推广。简单地说,映射是一个集合 M M M 到另一个集合 N N N 的对应法则, M 、 N M、N M、N 不局限于数集合。学习映射概念的时候,只需和函数概念对照着体会就很容易掌握它。在学习这一单元的时候,要注意满射、单射和 1 − 1 1-1 1−1 映射这几个概念的定义和区别,学会运用定义验证一个对应法则是映射、满射、单射或 1 − 1 1-1 1−1 映射的基本方法。关于映射的乘法是读者在本学科中遇到的第一个不是“数的运算”,并且这种运算不满足交换律。这一性质和数的加法或数的乘法满足交换律的性质是不同的。映射的乘法在后面的学习中经常要用到,由映射的乘法所定义的有逆映射,今后将占一个特殊地位。
复数的建立回答了 a + b i a+bi a+bi 究竟是什么意思,也就是说搞清楚了 i i i 是什么。“ a + b ⋅ i a+b\cdot i a+b⋅i” 中的“+”“ ⋅ \cdot ⋅”不是实数的加法和乘法,它们是什么运算?通过这些问题可以初步体会较严格地建立某一数系的方法。
由有理数集、实数集、复数集总结得出的数域这一概念是很重要的代数体系,其中可以进行加、减、乘、除四种运算(零不能作除数)。这是我们认识的第一个代数体系。
自学的读者在学习这一单元的时候,切不可性急。由于刚刚接触抽象的概念,不易理解和掌握它,因此必须反复推敲,通过书上的例题和自己认真做练习来加深理解。真正掌握它还要靠以后使用这些概念时,不放过对它的再认识。
三、多项式论
这个单元包括北大数力系编《高等代数》的第一章或张禾瑞等编《高等代数》的第二章。内容的大部分是中学代数里学过的。但是这里用到的概念都有严格的定义。这部分系统地讨论了数域上一元多项式的整除性理论和因式分解问题,并且论证了数域上一元多项式的“形式定义”和“函数定义”的统一性。这些讨论从理论上完善了中学代数关于多项式的讨论,从而加深对某些问题的理解。
在学习多项式的整除性理论的时候,千万不要把“整除”和“除法”混淆。我们说数域 F F F 上多项式 g ( x ) g(x) g(x) 能整除 f ( x ) f(x) f(x),就是说存在 F [ x ] F[x] F[x] 的多项式 h ( x ) h(x) h(x) 使得
f ( x ) = g ( x ) h ( x ) 。 ( 3 ) f(x)=g(x)h(x) 。(3) f(x)=g(x)h(x)。(3)
根据这个定义,零多项式能整除零多项式。但是不许以零多项式去除任何其他多项式。初学者还需要认真体会多项式的整除性质的论证方法,也就是从定义出发经过严格的逻辑推理得出需要的结论来。这是代数学的一个基本原则,是必须注意的。书上论证的一些整除性质也必须牢牢记住,搞清它们的含义和区别,以后经常要用到。带余除法是整除性理论的一个基本定理,也就是中学课本里所说的“长除法”。由它可以推导出求两个多项式的最大公因式的辗转相除法,还可以推出一次因式和多项式的根的关系等。由于用一个非零多项式去除另一多项式的时候所得的商式和余式是唯一确定的,因而,多项式 g ( x ) g(x) g(x) 能不能整除多项式 f ( x ) f(x) f(x) 都和数域的扩大没有关系。这一事实带给我们很大的方便。求两个多项式的最大公因式的辗转相除法是很容易理解的,必须掌握它。
由于两个多项式的最大公因式不是绝对唯一的,也就是可以相差一个零次多项式,所以要引入符号 ( f ( x ) , g ( x ) ) (f(x),g(x)) (f(x),g(x)) ,用它来表示 f ( x ) , g ( x ) f(x),g(x) f(x),g(x) 的首系数是 1 1 1 的最大公因式。这样一来, ( f ( x ) , g ( x ) ) (f(x),g(x)) (f(x),g(x)) 表示的就是 f ( x ) , g ( x ) f(x),g(x) f(x),g(x) 的一个唯一确定的最大公因式。
互素多项式和不可约多项式,在多项式的讨论中都占有重要的地位。要牢记它们的定义和性质,并且要会应用它们的性质论证问题。本来这是两个完全不同的概念,但是初学者总是容易混淆。学习的时候,一方面要认真钻研一下它们各自的定义,另一方面可以试着归纳一下它们各自的用处。判断两个多项式互素的充分和必要条件是很重要的定理,就是: F [ x ] F[x] F[x] 的两个多项式 f ( x ) f(x) f(x) 和 g ( r ) g(r) g(r) 互素的充要条件是:在 F [ x ] F[x] F[x] 中可以求得多项式 u ( x ) u(x) u(x) 和 u ( x ) u(x) u(x),使得(4)。读者可以自己总结一下它的作用。
f ( x ) u ( x ) + g ( x ) u ( x ) = 1 ( 4 ) f(x)u(x)+g(x)u(x)=1 (4) f(x)u(x)+g(x)u(x)=1(4)
多项式的因式分解定理,肯定了数域上一元多项式分解成不可约多项式乘积的可能性和唯一性,这定理在理论上起着很重要的作用。但是,它没有解决怎样分解的问题。到现在也还没有解决这个问题。
另外,我们必须注意多项式分解成不可约多项式的乘积同数域有关,也就是说同一个多项式在不同数域上分解成不可约多项式的乘积的时候,出现在分解式中的不可约多项式可能不同(这种不同不仅是相差一个零次多项式)。例如,多项式
x
4
−
1
x^4-1
x4−1,在复数域上分解成
(
x
+
i
)
(
x
−
i
)
(
x
−
1
)
(
x
+
1
)
;
(
5
)
(x+i)(x-i)(x-1)(x+1); (5)
(x+i)(x−i)(x−1)(x+1);(5)
在实数域上却分解成(6)。因而一个多项式是不是可约也和数域有关。例如, x 2 + 1 x^2+1 x2+1 在实数域上不可约,但是,在复数域上就可约了。 ( x 2 + 1 ) ( x − 1 ) ( x + 1 ) ( 6 ) (x^2+1)(x-1)(x+1) (6) (x2+1)(x−1)(x+1)(6)
读者必须牢记复数域上的不可约多项式只能是一次的,而实数域上的不可约多项式除一次多项式外,还有含非实共轭复数根的二次多项式。至于要判断其他数域上的多项式是否可约是件很麻烦的事,至今没有一般的方法。只能对一些特殊的多项式采用特殊的方法进行判断, 比如对有理数域上的某些多项式可以用艾森斯坦因判别法。但是,要注意这个判别法的条件只是充分条件而不是必要条件。
讨论实际问题,常常需要求多项式的根,在计算方法课程里可以给出近似解法,这些近似解法在实际应用中完全可以满足要求。在我们这门课里,删去了这方面的讨论,只讨论了根的个数问题、根和系数的关系、一次因式和根的关系等等。这些讨论有利于具体求根的工作,同时可以把多项式的“形式定义”和“函数定义”统一起来。中学课本对于这两种定义,总是不加区分地随意使用,比如在作多项式的加法、乘法等运算的时候,就按“形式定义”处理;在求多项式的值的时候,又按函数定义处理。证明了两种定义的统一性就保证了过去中学课本中的处理的合理性。今后我们也可以随意按哪一种定义来理解多项式。初学者对这个问题需认真思考,不然,很可能认为是很明显的事实,或者认为是不可理解的事实。
在这个单元里提到了“代数基本定理”,我们暂时可以不管它的证明。但是,要看到它的作用。这个定理的名称是有历史原因的。十九世纪中叶以前,代数学的研究中心是四则运算以及解方程问题,因此,“ n n n 次方程在复数域中有 n n n 个根”被叫做代数基本定理。一百多年后的今天,数学向前发展了,代数早已改变了它的中心,但是为了尊重历史,还是沿用这个名称。
自学的读者在学习这一单元的时候应注意以下两个问题:
第一,本单元的内容大部分是读者熟习的。先入为主的意识会使你的旧知识阻碍你接受新知识,以致漠然对待现在的严格定义和严格论证,必须谨防这个弊病。希望读者在学习的时候要认真钻研教材,要使原来所学的知识帮助我们加深对概念的理解,搞清论证的实质,切不可使原来所学的知识成为“拌脚石”。
第二,本单元涉及的概念比较多,要注意它们各自的特点和相互间的联系。读者不仅要理解这些概念,而且要会应用。为了达到这一要求读者在学习教材的时候必须仔细分析课本里给出的论证和证明,弄清每一步的根据。遇到看不懂的地方就返回去复习有关概念和推理,不可轻易放过。在做习题的时候也必须做到步步有依据。
四、行列式
这个单元包括北大数力系编《高等代数》的第二章或张禾湍等编《高等代数》的第三章。主要内容是介绍 n n n 阶行列式的定义、性质和它的计算,以及应用行列式理论给出克莱姆规则。行列式的应用很广泛,在我们这门课里可以看到用它解线性方程组、判断向量组线性相关还是线性无关、求矩阵的秩和求矩阵的逆矩阵等等,通过这些问题的讨论已足够体会行列式这件工具的重要作用。
n n n 阶行列式的定义和性质是具体分析了二阶、三阶行列式计算的规律后给出的。因此,在学习 n n n 阶行列式的定义和性质的时候,要结合二阶、三阶行列式来体会,并且要牢记 n n n 阶行列式的定义和性质,它们是以后讨论问题的出发点。 n n n 阶行列式的计算需要有一定的技巧,这就要靠多练,要善于总结规律,掌握常用的基本技能,比如用逐次降阶的方法然后依行(或依列)展开行列式,或找出递推公式,或用数学归纳法等等。
利用 n n n 阶行列式解含 n n n 个未知量 n n n 个方程的线性方程组的方法——克莱姆规则,一方面给出了这类方程组的解法,另一方面给出的求解公式在理论上也很重要。
学习这个单元的时候,读者注意锻炼自己的计算技巧,切记在计算 n n n 阶行列式的时候不要乱套二阶或三阶行列式的展开方法。
五、线性方程组理论
这个单元包括北大数力系编《高等代数》的第三章或张禾瑞等编《高等代数》的第四章。讨论的对象是含有任意个未知量的任意个方程构成的线性方程组
{
a
11
x
1
+
a
12
x
2
+
⋯
+
a
1
n
x
n
=
b
1
a
21
x
1
+
a
22
x
2
+
⋯
+
a
2
n
x
n
=
b
2
⋮
a
m
1
x
1
+
a
m
2
x
2
+
⋯
+
a
m
n
x
n
=
b
m
(
7
)
\mathsf{\left\{\begin{array}{c} a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=b_1\\ a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n=b_2\\ \vdots\\ a_{m1}x_1+a_{m2}x_2+\cdots+a_{mn}x_n=b_m \end{array}\right.}(7)
⎩
⎨
⎧a11x1+a12x2+⋯+a1nxn=b1a21x1+a22x2+⋯+a2nxn=b2⋮am1x1+am2x2+⋯+amnxn=bm(7)
其中三个问题:第一,怎样判断一个线性方程组有解?第二,如果一个线性方程组有解,它有多少解?第三,如果一个线性方程组有解,怎样求解?解决这三个问题的途径有二条:用消元法或用线性方程组可解的判别法。
消元法简单明了、容易掌握,是极重要的,读者一定要熟练地掌握它。
有时候,我们希望直接由线性方程组的系数和常数项来判断方程组是否有解。这样,就需要通过线性方程组可解的判别法来解决。这就是线性方程组有解的充分必要条件是它的系数矩阵和增广矩阵有相同的秩。
这个判别法在理论上很重要。读者除去学会使用这个判别法外,还需搞懂它的推导方法。并且在学习判别法的推证的时候注意掌握矩阵的秩的两种定义的等价性;体会这两种定义各自的特点和联系以及为什么要引入两种定义。
在线性方程组的讨论中,齐次线性方程组占有特殊重要的地位。在今后的学习中要注意应用齐次方程组可以解决哪些问题。
齐次线性方程组肯定有解。主要研究怎样判断它有非零解和求齐次线性方程组的基础解系。对于这两个问题要求读者掌握得很熟练。
学习这个单元的时候,读者要初步体会矩阵这件工具的重要作用。特别是矩阵的初等变换要牢牢掌握。这在今后的学习中是经常用到的。
六、矩阵
这个单元包括北大数力系编《高等代数》的第四章或张禾瑞等编《高等代数》的第五章,主要介绍矩阵的运算和它的一些基本性质。1850年,英国人西尔维斯特提出矩阵概念,1858年,凯莱建立矩阵运算规则以来,对矩阵的认识和作用在许多方面得到了发展和应用,使它成了线性代数的一个重要研究对象。
在学习这一单元的时候,从概念上讲读者不会遇到什么困难。但是要注意引入各种运算时候的条件,不能乱套用。比如两个矩阵A、B相乘的时候,要求A的列数等于B的行数。又如求矩阵A的逆矩阵,要求A是方阵并且 ∣ A ∣ \left|A\right| ∣A∣不等于零等等。要牢记各种运算的规则,和它们满足的运算定律。切记矩阵不适合交换律。要熟记初等变换和初等矩阵的对应关系。
七、向量空间和它的线性变换
这个单元包括北大数力系编《高等代数》或张禾瑞等编《高等代数》的第六、七两章。这部分内容很多,主要应掌握向量空间和子空间的概念、向量的线性相关性、向量空间的基和维数、向量的坐标和向量空间的同构,线性变换的概念和它的运算、线性变换和矩阵、不变子空间、特征根和特征向量等。
向量空间是读者接触的第一个抽象的代数结构。刻画向量空间的公理条文又比较多,初学者会感到既不好理解又难于记忆。这就希望读者认真地分析一下书里给出的例子,特别是解析几何中学过的"二维空间(平面)“和"三维空间”,还有数域 F F F 上 n n n 维向量作成的向量空间 F n = { ( a 1 , a 2 , ⋯ , a n ) ∣ a i ∈ F } F^n=\lbrace(a_1,a_2,\cdots,a_n) |a_i\in F\rbrace Fn={(a1,a2,⋯,an)∣ai∈F} 都是很容易理解而在今后学习中又常要用到的向量空间。向量的线性相关性这部分内容是线性代数重要基本概念集中的地方,学起来会感到困难,主要是概念太多。学习的时候要注意它们之间的区别,同时也要看到它们之间的联系,要吃透书上的例题,读者自己也可以试着举些例子,要有正面例子,也要有反面例子,正反两方面反复对比就不难掌握这些概念了。
这部分内容中的“替换定理”十分重要,也非常有用。读者应该总结一下它的用处。常常有人搞不懂线性相关和线性无关这两个最基本的概念,因而也就不会判断一个向量组是否线性相关。读者不妨这样来理解定义:给出向量组 a 1 , a 2 , ⋯ , a n a_1,a_2,\cdots,a_n a1,a2,⋯,an,如果能由等式
k 1 a 1 + k 2 a 2 + ⋯ + k n a n = 0 ( 8 ) k_1a_1+k_2a_2+\cdots+k_na_n=0 (8) k1a1+k2a2+⋯+knan=0(8)
的成立,推得一组不全是零的数 k 1 , k 2 , ⋯ , k n k_1,k_2,\cdots,k_n k1,k2,⋯,kn 来,那么向量组 a 1 , a 2 , ⋯ , a n a_1,a_2,\cdots,a_n a1,a2,⋯,an 线性相关;如果上面的等式成立, k 1 , k 2 , ⋯ , k n k_1,k_2,\cdots,k_n k1,k2,⋯,kn 必须全是零,那么向量组 a 1 , a 2 , ⋯ , a n a_1,a_2,\cdots,a_n a1,a2,⋯,an 线性无关。
基、维数、坐标这部分内容很重要,因为各个具体的量空间,尽管各有自己的属性,但是,它们又都符合向量间定义的要求,因而必然有些共同性质。把这些共性取出来才能找到一个研究向量空间的统一方法。讲向量空间的基、维数和向量的坐标就是为了给研究向量空间提供统一的工具和方法。这也是代数学处理问题的一般方法。理解这部分内容本身,读者不会感到什么困难,可能作练习题的时候,由于涉及线性相关性那部分的概念比较多,因而会感到不好做。但是,读者可以通过这一部分的练习,巩固前边所学的知识和概念。认真总结一下用了以前哪些概念,对这些概念有哪些进一步的理解,这样总结多了,对学习会有益处的。
学习向量空间的同构可以把数域 F F F 上的任意 n n n 维向量空间都看作 F n F^n Fn,讨论起来就具体多了。
线性变换是这个单元的重点,首先要搞清线性变换的定义,不但要记住定义中的条件,而且要掌握几个重要线性变换,比如单位变换(恒等变换)、位似变换、平面(或空间)上的旋转等等,这些简易的例子有助于理解关于线性变换的 一些讨论。线性变换的运算不难掌握,但是,要弄清线性变换的和仍是线性变换、线性变换的积仍是线性变换、数 k k k 和线性变换的纯量积仍是线性变换等事实的证明,从中理解线性变换的实质。
线性变换和矩阵的关系是研究线性变换的重要关键,首先要弄清怎样定义一个线性变换关于给定基下的矩阵,并且反过来会用矩阵来定义一个线性变换,从而在线性变换和矩阵之间建立一一对应关系,于是能把线性变换的讨论转化到矩阵上。由于矩阵比较具体,讨论起来要方便多了。读者要学会用矩阵这个工具来研究线性变换。其次要弄清,给定的一个线性变换,关于不同基的矩阵是不同的,而这些矩阵之间的关系是相似的,从而引出了标准形的问题。初学的读者只需要了解什么叫矩阵的标准形就可以了,至于怎样决定矩阵的标准形就不必深究了。
线性变换(或矩阵)的特征根和特征向量,不仅在代数学里,而且在其他学科(如常微分方程)里,都占着重要的地位。读者一定要掌握线性变换的特征根和特征向量,要掌握矩阵的特征根和特征向量的定义,注意它们之间的联系和区别。会求线性变换和矩阵的特征根和特征向量,虽然计算上没有什么困难,但是不可忽视求法的理论推导。
八、欧几里得空间和它的线性变换
这个单元包括北大数力系编《高等代数》的第九章或张禾瑞编《高等代数》的第八章。内容主要讨论欧几里得空间的结构和它的主要线性变换﹣﹣正交变换和对称变换。学习前一部分的时候,要抓住“内积”这个概念。内积是什么?实际上它是一种对应规则,给实数域上向量空间 V V V 的任意两个向量 α , β \alpha,\beta α,β 配置一个实数,记作 ( α , β ) (\alpha,\beta) (α,β) 。这是 推广了的映射,并且要求它有三种性质:对称性: ( α , β ) = ( β , α ) (\alpha,\beta)=(\beta,\alpha) (α,β)=(β,α);线性性 ( α + β , γ ) = ( α , γ ) + ( β , γ ) (\alpha+\beta,\gamma)=(\alpha,\gamma)+(\beta,\gamma) (α+β,γ)=(α,γ)+(β,γ),正定性: a ≠ 0 a \ne 0 a=0 时 ( α , α ) > 0 (\alpha,\alpha)\gt 0 (α,α)>0。同时,我们也把两向量 α , β \alpha,\beta α,β 对应的实数 ( α , β ) (\alpha,\beta) (α,β) 叫做 α , β \alpha,\beta α,β 的内积。二者虽然用同一个名称,在使用的时候,是不会混淆的。实数域 R R R 上的向量空间 V V V 有了内积,就可以变成欧几里得空间。利用内积可以定义 V V V 中向量的长度、两个非零向量的夹角。这样,我们所讨论的欧几里得空间和解析几何中的二维或三维空间有了很类似的性质,都是带有度量的向量空间。
在学习有限维欧几里得空间的结构的时候,必须搞清楚怎样用矩阵刻画欧几里得空间里的内积,并且牢记内积关于欧几里得空间某一取定基的矩阵是对称矩阵。特别要注意欧几里得空间中某一取定基的矩阵关于空间不同基的矩阵是不同的,这些矩阵之间的关系是合同的。这个问题类似于讨论一个固定线性变换关于空间不同基的矩阵是相似的。学习的时候可以前后对照着考虑。如果在欧几里得空间里可以选择正交基或标准正交基,那么,不仅空间中的每个向量可以用它关于这个正交基(或标准正交基)的坐标来代表,而且空间中任意两个向量的内积也可以用两个向量对应的坐标乘积的和给出。这样一来,任意 n n n 维欧几里得空间都可以看成 R n R^n Rn 了,给我们研究任意 n n n 维欧几里得空间提供了方便。因此,决定一个有限维欧几里得空间的正交基是极其重要的。这个问题解决的比较圆满,任意给 n n n 维欧几里得空间 V V V 一组线性无关的向量,都可以把这组向量正交化,从而得知有限维欧几里得空间一定有正交基,当然也就有标准正交基了。关于这部分论推导。内容,读者一定要掌握"正交化方法",并且搞清楚它的理论推导。
在欧几里得空间中定义了向量的长和两个非零向量的夹角以后,有许多性质类似于解析几何里讨论向量时候的性质。读者在学习的时候,应认真地对比一下,这样既可以加深对概念的理解,又可以体会到某些概念推广后的威力。数学理论的发展有不少工作是属于推广方面的。
欧几里得空间中主要的线性变换是正交变换和对称变换。自学的时候,要注意抓住它们各自的特点,特别是它们对应的矩阵的特点。正交变换对应的是正交矩阵,对称变换对应的是对称矩阵,这两种矩阵在线性代数中应用最多,读者可以有意识地注意一下它们各自的作用。
这个单元的内容学起来会感觉比前一章容易些,主要是因为欧几里得空间是解析几何中普通空间的推广,许多性质都比较容易理解。但是,也容易受旧知识的束缚。比如两个向量正交是垂直概念的推广,在几何里不能说零向量和任意向量垂直(按两向量的夹角是90。就说这两个向量垂直),但是,在欧几里得空间里,零向量和任意向量正交。读者可以自己归纳一下,一般欧几里得空间里有哪些概念、性质是几何空间里某些概念、性质的推广?推广后是否有不同的地方?作这种练习对初学者是很有益处的。
九、二次型和对称矩阵
这个单元包括北大数力系编《高等代数》的第五章和第九章第6节,或张禾瑞编《高等代数》的第九章部分内容。读者主要掌握以下内容:
关于二次型和它的矩阵,必须搞清楚每有一个二次型就有一个唯一确定的矩阵和它对应,反过来,每有一个对称矩阵也唯一地决定一个二次型。这种一对一的关系可以把二次型的研究转化成为矩阵的问题。
非退化线性替换用矩阵表示,可以写成 X = P Y X=PY X=PY,其中 P P P 是可逆矩阵。
这个单元的主要问题是二次型在非退化线性替换下怎样
化简,主要定理就是:
数域 F F F 上任何二次型在非退化线性替换下,可以化成:
C 1 x 1 2 + C 2 x 2 2 + ⋯ + C n x n 2 。 ( 9 ) C_1x_1^2+C_2x_2^2+\cdots+C_nx_n^2。(9) C1x12+C2x22+⋯+Cnxn2。(9)
这个定理也叫做化二次型为标准型的定理。
标准型的唯一性问题仅在复数域和实数域上讨论,这一部分重要的结果是实数域上二次型的惯性定律。
读者学习上述几个问题一定要随时注意二次型和矩阵的对应关系,关于二次型研究的某些结果能“翻译”到矩阵上,反过来也可以做。
关于实数域上的二次型还有两个问题也很重要。第一,实二次型可以经过可逆线性替换 X = U Y X=UY X=UY、(其中U是正交矩阵)化成
λ 1 y 1 2 + λ 2 y 2 2 + ⋯ + λ n y n 2 。 ( 10 ) λ_1y_1^2+λ_2y_2^2+\cdots+λ_ny_n^2 。(10) λ1y12+λ2y22+⋯+λnyn2。(10)
其中 λ 1 , λ 2 , ⋯ , λ n \lambda_1,\lambda_2,\cdots,\lambda_n λ1,λ2,⋯,λn 是实二次型的矩阵的特征根。这个问题的讨论正是解析几何上二次曲线(或二次曲面)经坐标轴的旋转化到主轴上的推广。用矩阵语言可以这样叙述:对于任意 n n n 阶实对称矩阵 A A A,都存在一个 n n n 阶正交矩阵 U U U 使
U ′ A U = ( λ 1 λ 2 ⋱ λ n ) . ( 11 ) U'AU=\begin{pmatrix}\lambda_1& & & \\ &\lambda_2& & &\\ & &\ddots& \\ & & &\lambda_n\end{pmatrix}. (11) U′AU= λ1λ2⋱λn .(11)
其中 λ 1 , λ 2 , ⋯ , λ n \lambda_1,\lambda_2,\cdots,\lambda_n λ1,λ2,⋯,λn 是 A A A 的全部特征根。
第二,关于正定实二次型,读者主要掌握正定二次型的特点和常用的判定条件。
十、自我测试题
1、设 f f f 是 A A A 到 B B B 的一个映射, g g g 是 B B B 到 A A A 的一个映射,如果 f ⋅ g = j B f \cdot g=j_B f⋅g=jB,证明: f f f 是满射, g g g 是单射。
2、设
n
n
n 阶行列式
D
n
=
∣
1
+
a
2
0
0
⋯
0
0
0
0
1
+
a
2
0
⋯
0
0
0
⋮
⋮
⋮
⋯
⋮
⋮
⋮
0
0
0
⋯
0
1
+
a
2
0
0
0
0
⋯
0
0
1
+
a
2
∣
D_n=\begin{vmatrix}{1+a^2}&{0}&{0}&{\cdots}&0&0&0\\{0}&{1+a^2}&{0}&{\cdots}&0&0&0\\{\vdots}&{\vdots}&{\vdots}&{\cdots}&{\vdots}&{\vdots}&{\vdots}\\{0}&{0}&{0}&{\cdots}&0&{1+a^2}&0\\{0}&{0}&{0}&{\cdots}&0&0&{1+a^2}\end{vmatrix}
Dn=
1+a20⋮0001+a2⋮0000⋮00⋯⋯⋯⋯⋯00⋮0000⋮1+a2000⋮01+a2
,
(1) 证明:
D
n
−
D
n
−
1
=
a
2
(
D
n
−
1
−
D
n
−
2
)
D_n-D_{n-1}=a^2(D_{n-1}-D_{n-2})
Dn−Dn−1=a2(Dn−1−Dn−2);
(2) 用数学归纳法计算
D
n
D_n
Dn 。
3、如果线性方程组 { a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n = b 2 ⋮ a m 1 x 1 + a s 2 x 2 + ⋯ + a m n x n = b m 【 1 】 \mathsf{\left\{\begin{array}{c} a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=b_1\\ a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n=b_2\\ \vdots\\ a_{m1}x_1+a_{s2}x_2+\cdots+a_{mn}x_n=b_m \end{array}\right.}【1】 ⎩ ⎨ ⎧a11x1+a12x2+⋯+a1nxn=b1a21x1+a22x2+⋯+a2nxn=b2⋮am1x1+as2x2+⋯+amnxn=bm【1】 有解,那么线性方程组 { a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n − b 1 x n + 1 = 0 a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n − b 2 x n + 1 = 0 ⋮ a m 1 x 1 + a m 2 x 2 + ⋯ + a m n x n − b m x n + 1 = 0 【 2 】 \mathsf{\left\{\begin{array}{c} a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n-b_1x_{n+1}=0\\ a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n-b_2x_{n+1}=0\\ \vdots\\ a_{m1}x_1+a_{m2}x_2+\cdots+a_{mn}x_n-b_mx_{n+1}=0 \end{array}\right.}【2】 ⎩ ⎨ ⎧a11x1+a12x2+⋯+a1nxn−b1xn+1=0a21x1+a22x2+⋯+a2nxn−b2xn+1=0⋮am1x1+am2x2+⋯+amnxn−bmxn+1=0【2】 有非零解。反过来,如果(2)有使 x n + 1 ≠ 0 x_{n+1}\ne 0 xn+1=0 的解,那么(1)也有解。
4、(1) 设 f ( x ) f(x) f(x) 是复数系多项式, d ( x ) = ( f ( x ) , f ˉ ( x ) ) d(x)=(f(x),\bar{f}(x)) d(x)=(f(x),fˉ(x)) 。证明:实数 a a a 是 f ( x ) f(x) f(x) 的根 ⟷ \longleftrightarrow ⟷ a a a 是 d ( x ) d(x) d(x) 的根;(2) 如果 h ( x ) ∣ f ( x ) g ( x ) h(x)|f(x)g(x) h(x)∣f(x)g(x),问 h ( x ) h(x) h(x) 能否整除 f ( x ) f(x) f(x) ?试举例说说明。
5、把矩阵 A = ( 1 1 − 1 3 − 1 1 − 3 1 0 ) A=\begin{pmatrix}1&1&-1\\3&-1&1\\-3&1&0\end{pmatrix} A= 13−31−11−110 写成初等矩阵的积,并求出它的逆矩阵。
6、设
V
=
{
(
a
b
−
b
a
)
∣
a
,
b
∈
R
}
V=\Bigg\{\begin{pmatrix}a&b\\-b&a\end{pmatrix}\Big|a,b\in R\Bigg\}
V={(a−bba)
a,b∈R} ,
(1) 证明:对于矩阵的加法和纯量乘法来说,
V
V
V 作成实数域
R
R
R 上的向量空间;
(2) 求向量空间
V
V
V 的基和维数。
7、设
R
3
=
{
a
=
(
x
1
x
2
x
3
)
∣
x
1
,
x
2
,
x
3
∈
R
}
R^3=\Bigg\{a=\begin{pmatrix}x_1\\x_2\\x_3\end{pmatrix}\Bigg|x_1,x_2,x_3\in R\Bigg\}
R3={a=
x1x2x3
x1,x2,x3∈R} 。
(1) 证明:
η
1
=
(
−
1
1
1
)
\eta_1=\begin{pmatrix}-1\\1\\1\end{pmatrix}
η1=
−111
,
η
2
=
(
1
0
−
1
)
\eta_2=\begin{pmatrix}1\\0\\-1\end{pmatrix}
η2=
10−1
,
η
3
=
(
0
1
1
)
\eta_3=\begin{pmatrix}0\\1\\1\end{pmatrix}
η3=
011
是
R
3
R^3
R3 的一个基;
(2) 令
ϵ
1
=
(
1
0
0
)
\epsilon_1=\begin{pmatrix}1\\0\\0\end{pmatrix}
ϵ1=
100
,
ϵ
2
=
(
0
1
0
)
\epsilon_2=\begin{pmatrix}0\\1\\0\end{pmatrix}
ϵ2=
010
,
ϵ
3
=
(
0
1
1
)
\epsilon_3=\begin{pmatrix}0\\1\\1\end{pmatrix}
ϵ3=
011
,求基
{
ϵ
1
,
ϵ
2
,
ϵ
3
}
\lbrace\epsilon_1,\epsilon_2,\epsilon_3\rbrace
{ϵ1,ϵ2,ϵ3} 到基
{
η
1
,
η
2
,
η
3
}
\lbrace\eta_1,\eta_2,\eta_3\rbrace
{η1,η2,η3} 之间的过渡矩阵;
(3) 求
R
3
R^3
R3 中分别在基
{
ϵ
1
,
ϵ
2
,
ϵ
3
}
\lbrace\epsilon_1,\epsilon_2,\epsilon_3\rbrace
{ϵ1,ϵ2,ϵ3} 和基
{
η
1
,
η
2
,
η
3
}
\lbrace\eta_1,\eta_2,\eta_3\rbrace
{η1,η2,η3} 下有相同坐标的向量;
(4) 设
σ
\sigma
σ 是
R
3
R^3
R3 的一个线性变换,
σ
\sigma
σ 关于基
{
η
1
,
η
2
,
η
3
}
\lbrace\eta_1,\eta_2,\eta_3\rbrace
{η1,η2,η3} 的矩阵是
A
=
(
1
0
1
1
1
0
−
1
2
1
)
,
A=\begin{pmatrix}1&0&1\\1&1&0\\-1&2&1\end{pmatrix},
A=
11−1012101
, 求
σ
\sigma
σ 关于基
{
ϵ
1
,
ϵ
2
,
ϵ
3
}
\lbrace\epsilon_1,\epsilon_2,\epsilon_3\rbrace
{ϵ1,ϵ2,ϵ3} 的矩阵;
(5) 求
σ
\sigma
σ 的象空间和核空间。
8、设 α 1 , α 2 , ⋯ , α n \alpha_1,\alpha_2,\cdots,\alpha_n α1,α2,⋯,αn 是数域 F F F 上 n n n 维向量空间 V V V 的一组向量,证明 α 1 , α 2 , ⋯ , α n \alpha_1,\alpha_2,\cdots,\alpha_n α1,α2,⋯,αn 作成 V V V 的一组基的必要充分条件是: V = L ( a 1 ) ⊕ L ( a 2 ) + ⋯ + L ( a n ) 。 V=L(a_1)\oplus L(a_2)+\cdots+L(a_n) 。 V=L(a1)⊕L(a2)+⋯+L(an)。
充分性证明: 已知 V = L ( α 1 ) ⊕ L ( α 2 ) ⊕ ⋯ ⊕ L ( α n ) V=L(α_1)⊕L(α_2)⊕⋯⊕L(α_n) V=L(α1)⊕L(α2)⊕⋯⊕L(αn)。根据直和定义,对于任意 β ∈ V β\in V β∈V, β \beta β 可唯一表示为 β = k 1 α 1 + ⋯ + k n α n , k i ∈ F , i = 1 , 2 , ⋯ , n \beta=k_1\alpha_1+\cdots+k_n\alpha_n, k_i\in F, i=1,2,\cdots,n β=k1α1+⋯+knαn,ki∈F,i=1,2,⋯,n 。满足向量空间的基的定义,即向量组 α 1 , ⋯ , α n \alpha_1,\cdots,\alpha_n α1,⋯,αn 可线性表示 V V V 中的的任意向量且表示方式唯一,故 α 1 , ⋯ , α n \alpha_1,\cdots,\alpha_n α1,⋯,αn 是 V V V 的一组基。
必要性证明: 已知 α 1 , ⋯ , α n \alpha_1,\cdots,\alpha_n α1,⋯,αn 是 V V V 的一组基,证明 V = L ( α 1 ) + ⋯ + L ( α n ) V=L(\alpha_1)+\cdots+L(\alpha_n) V=L(α1)+⋯+L(αn) 。对任意 β ∈ V \beta\in V β∈V,因 α 1 , ⋯ , α n \alpha_1,\cdots,\alpha_n α1,⋯,αn 是基,故 β = k 1 α 1 + ⋯ + k n α n , k i ∈ F , i = 1 , ⋯ , n \beta=k_1\alpha_1+\cdots+k_n\alpha_n, k_i\in F,i=1,\cdots,n β=k1α1+⋯+knαn,ki∈F,i=1,⋯,n。因 k i α i ∈ L ( α i ) k_i\alpha_i\in L(\alpha_i) kiαi∈L(αi),得 β ∈ L ( α 1 ) + L ( α 2 ) + ⋯ + L ( α n ) \beta\in L(\alpha_1)+L(\alpha_2)+\cdots+L(\alpha_n) β∈L(α1)+L(α2)+⋯+L(αn) ,即 V ⊆ L ( α 1 ) + L ( α 2 ) + ⋯ + L ( α n ) V \subseteq L(\alpha_1)+L(\alpha_2)+\cdots+L(\alpha_n) V⊆L(α1)+L(α2)+⋯+L(αn) 。又因 L ( a i ) ⊆ V L(a_i)\subseteq V L(ai)⊆V,故 L ( α 1 ) + L ( α 2 ) + ⋯ + L ( α n ) ⊆ V L(\alpha_1)+L(\alpha_2)+\cdots+L(\alpha_n)\subseteq V L(α1)+L(α2)+⋯+L(αn)⊆V,故 V = L ( α 1 ) + L ( α 2 ) + ⋯ + L ( α n ) V=L(\alpha_1)+L(\alpha_2)+\cdots+L(\alpha_n) V=L(α1)+L(α2)+⋯+L(αn) 。
证明是直和: 设 0 = k 1 α 1 + ⋯ + k n α n , 0=k_1\alpha_1+\cdots+k_n\alpha_n, 0=k1α1+⋯+knαn, 因 α 1 , ⋯ , α n \alpha_1,\cdots,\alpha_n α1,⋯,αn 线性无关,故 k 1 = ⋯ = k n = 0 k_1=\cdots=k_n=0 k1=⋯=kn=0。根据直和等价定义,零向量表示唯一,所以 V = L ( α 1 ) ⊕ L ( α 2 ) ⊕ ⋯ ⊕ L ( α n ) V=L(\alpha_1)\oplus L(\alpha_2)\oplus \cdots\oplus L(\alpha_n) V=L(α1)⊕L(α2)⊕⋯⊕L(αn)。
综述, α 1 , ⋯ , α n \alpha_1,\cdots,\alpha_n α1,⋯,αn 是 V V V 的一组基的充要条件是 V = L ( α 1 ) ⊕ L ( α 2 ) ⊕ ⋯ ⊕ L ( α n ) V=L(\alpha_1)\oplus L(\alpha_2)\oplus \cdots\oplus L(\alpha_n) V=L(α1)⊕L(α2)⊕⋯⊕L(αn) 。
9、设 A = ( 0 0 1 0 1 0 1 0 0 ) , A=\begin{pmatrix}0&0&1\\0&1&0\\1&0&0\end{pmatrix}, A= 001010100 , 求一正交矩阵 U U U 使得 U ′ A U = ( λ 1 λ 2 λ 3 ) , U'AU=\begin{pmatrix}\lambda_1& & \\ &\lambda_2& \\ & &\lambda_3\end{pmatrix}, U′AU= λ1λ2λ3 ,,其中 λ 1 , λ 2 , λ 3 \lambda_1,\lambda_2,\lambda_3 λ1,λ2,λ3 是 A A A 的全部特征根。
10、设
V
V
V 是实数
R
R
R 上的向量空间,
R
R
R 可看作
R
R
R 上的向量空间,
σ
\sigma
σ 是
V
V
V 到
R
R
R 的一个线性映射,令
W
=
K
e
r
σ
W=Ker\sigma
W=Kerσ,
W
≠
{
0
}
W\ne \lbrace0\rbrace
W={0} 且
W
≠
V
W\ne V
W=V 。证明:
(1)
V
V
V 中的任一向量
α
\alpha
α 可写成
ζ
+
k
ζ
0
\zeta+k\zeta_0
ζ+kζ0,其中
k
∈
R
k\in R
k∈R;
(2)
V
=
W
⊕
L
(
ζ
0
)
V=W\oplus L(\zeta_0)
V=W⊕L(ζ0) 。
11、设 W W W 是 n n n 维欧几里得空间 V V V 的一个子空间,令 σ : ζ ⟶ ζ \sigma:\zeta\longrightarrow\zeta σ:ζ⟶ζ 是在 W W W 上的正射影,那么 σ \sigma σ 是 V V V 的一个线性变换,且 σ \sigma σ 关于 V V V 的任一标准正交基的矩阵 A A A 具有性质: A 2 = A A^2=A A2=A 。证明: ∣ σ ( ζ ) 2 ∣ + ∣ ( l − a ) ( ζ ) ∣ 2 \left|\sigma(\zeta)^2\right|+\left|(l-a)(\zeta)\right|^2 σ(ζ)2 +∣(l−a)(ζ)∣2 ( ∀ ζ ∈ V ) (\forall\zeta\in V) (∀ζ∈V),其中 l l l 是单位变换。
十一、博主目前自学高等代数所用的教材
- 《线性代数的几何意义》任广千
- 《高等代数简明教程(三卷本)》蓝以中
- 《高等代数典型问题与方法》樊启斌
这些书籍我买过来好几年了,但成年人重新学数学……唉。只能每天学一点吧,这个时代底层人如果再放不下的手机提升自己,她/他就没有未来了……
十二、更新时间记录
- “一、概述”收录完毕;「2025.3.20 17:15」
- “二、基本概念”收录完毕;「2025.3.30 17:34」
- “三、多项式论”收录完毕;「2025.3.30 17:56」
- “四、行列式”收录完毕;「2025.3.30 18:20」
- “五、线性方程组理论”收录完毕;「2025.3.30 18:27」
- “ 六、矩阵”收录完毕;「2025.3.30 18:30」
- “ 七、向量空间和它的线性变换”;「2025.3.30 18:46」
- “八、欧几里得空间和它的线性变换”收录完毕;「2025.3.30 19:03」
- “九、二次型和对称矩阵”收录完毕;「2025.3.30 19:38」
- “十、自我测试题”收录完毕;「2025.3.31 11:23 」
- 博主增加了红色字体;「2025.3.31 16:28」
- 增加“十一、博主目前自学高等代数所用的教材”。「2025.3.31 16:40」
P.S.全文包括数学符号共计一万三千四百多字。继第十篇和这一篇第十一篇后,后续还有第十二篇“《高等几何》陈绍菱”,那一篇是讲解仿射空间与射影的内容,只有着这三篇“欧氏空间的解析几何”、“高等代数(线性代数和多项式理论)”、“仿射几何与射影几何”合一才是真正的数学系大一、大二,乃至大三上学期该学的几何与代数部分内容。「2025.3.31 12:03」