大学教授对解析几何的看法
【按:因为看到学生们学习解析几何的问题, 一直想写这一部分内容, 在南京疫情笼罩的日子里, 正好可以安静地把想法整理出来。个人想法,一家之言,未必值得参考。】
正所谓“天下大势, 合久必分, 分久必合”, 高等代数与解析几何这两门课程就有这一趋势. 2002 年在北大做博士后, 讲授高等代数习题课, 没有解析几何; 2004 年后在南开讲课时, 高等代数与解析几何成了一门课; 如今在南大讲课, 二者之间“与”字变成了顿号, 又成了两门课.
从现状来看, 目前在国内各大学, 这两门课程合二为一和各自为政的状况都存在. 合并的原因大概是两个方面, 一是基础课的课时越来越少, 二是这两门课程很多重叠之处. 不过, 很多人会担心合并后几何的分量会被减弱, 甚至到可有可无的地步, 从而影响对学生的几何直观的培养. 这种担心也不是没有道理.
从教学时间上看, 南开合并后的高等代数与解析几何一门课在两个学期的周课时为 6+7 (各含两节习题课), 南大则是 5+5, 再加上第一学期的解析几何每周 2 课时, 总课时为 7+5. 也就是说南开合并后的一门课的课时要比南大两门课的多, 这还不算南大有小学期, 每学期只有 16-17 周, 而南开取消了小学期, 每学期 18-19 周. 一般的解析几何课的周学时是 2 学时, 去掉新生军训、国庆长假和期中考试, 能保证 15 周 30 课时就不错了.
从教学内容上看, 去掉几乎不可能讲到的射影几何部分, 解析几何课需要讲解矢量运算及内积外积和混合积、直线和平面方程、特殊曲线和曲面、坐标变换(等距变换、正交变换)、二次曲线和曲面的分类等. 由于课时少, 很多内容无法细讲, 如二次曲线和二次曲面的分类部分往往耗费时间也不容易讲清楚, 大概率会被略过. 然而这些内容在高等代数中都有对应部分, 甚至可以说解析几何是把高等代数的基础理论中的低维部分单独拿出来讲, 比如三元一次方程组、三维矢量空间、三元二次型、三维 Euclid 空间、三阶正交矩阵等. 问题是同期的高等代数一般只会讲多项式、行列式、线性方程组、矩阵和线性空间的部分内容等, 而二次曲线和二次曲面的分类需要的正交变换理论包含在高等代数第二学期的 Euclid 空间部分. 因此, 与解析几何相关的高等代数内容基本都是滞后地, 这种脱节自然会给解析几何的教学增添了新的麻烦.
从教学效果上看, 如果协调好的话, 二者可以相辅相成: 解析几何中直观的低维几何对象是高等代数的很好的例子; 高等代数中的一般理论可以让学生从本质上理解解析几何中的问题. 但是这并不容易, 实际情况可能是两门课各自为政, 没有高等代数的基础解析几何的很多内容不容易解释清楚, 初学者也很难理解为什么有那些奇怪的定义; 没有解析几何的背景, 高等代数课程也可能失去了几何直观. 2021 年春季学期刚开学时我曾经了解过学生们对上学期学过的解析几何的认识, 结果不乐观, 期末考试后很多学生就把解析几何忘光了(当然其他课如高代数分也会忘), 很多定义根本没理解, 应付考试主要是靠背公式, 二次曲线的分类已经不清楚了, 二次曲面的分类似乎都没学过. 我们所期待的解析几何课对于学生几何直观的培养似乎没多大效果, 而它与高等代数的衔接问题也让这个课程成了鸡肋, 这两门课程的割裂或许是对彼此的最大伤害.
从个人的教学体验看, 我倾向于合并. 我把高等代数的课程录屏放在网上, 当更新完 Euclid 空间部分, 就有学生留言问是否还有解析几何部分, 也有学生说没有解析几何部分的高等代数总觉得缺点什么, 我有同感. 这两门课程有太多的重叠, 合并起来既可以节省很多时间, 又可以更合理地协调二者的内容使其无缝衔接, 也有利于初学者们的理解. 在过去几年的高等代数教学中, 我尝试在适当章节引入解析几何的相应部分, 把解析几何作为高等代数各部分的低维例子, 建立几何直观, 并及时把相应理论拓展到一般情形, 然而由于课时关系, 一些想法难以实现, 不过还是值得去尝试.
高等代数与解析几何的衔接
解析几何与高等代数在内容上有如下的对应: 矢量的加法和数乘对应于线性空间, 矢量内积对应于 Euclid 空间, 矢量外积和混合积对应于行列式和矩阵, 直线和平面方程对应于线性方程组、子空间和正交关系, 二次曲线和二次曲面的分类则对应于二次型和正交变换. 由此可见, 解析几何的全部内容与高等代数都有关联, 我们可以在高等代数的相关章节讲授有关的解析几何内容, 或作为例子, 或作为应用.
解析几何中一般首先引入矢量的运算, 包括加法和数乘, 也就是矢量空间是一个线性空间, 因此这一部分是很直观的线性空间的例子. 其中, 矢量加法的平行四边形法则在初中物理中接触过, 这一法则初学时或许会感觉有一点怪异, 不过如果用坐标系来看就自然了. 中学已经学过坐标系, 在直角坐标系下, 平面上的点与其坐标一一对应, 其坐标是实数对 , 两个点之和的坐标自然应该是坐标之和. 从这一点来看, 平行四边形法则就比较自然了. 空间矢量的平行四边形法则也是类似的, 它们都是实向量空间 中加法的特殊情形. 内积、外积和混合积这些内容可以与行列式、矩阵结合起来, 这些定义也是在一些必要的计算中自然得到的.
平面直线、空间的直线和平面对应于线性空间的子空间及其陪集, 也可以对应于线性方程(组)的解空间, 其中涉及一些线性相关性.
二次曲线和二次曲面是一般的二次超曲面的特殊情形, 涉及二次型理论和正交变换, 尤其是对称矩阵正交相似标准形. 当然二次超曲面的方程中有一些一次项, 这就需要引入平移来处理. 不管是正交变换还是平移都是等距变换的特殊情形, 以 Euclid 空间理论为基础, 相关的讨论会变得相对简单而自然.
在与陈智奇合作的《高等代数与解析几何》一书中, 我们就是按上述想法把解析几何内容穿插到高等代数中. 当然, 在具体的教学过程中可以根据需要进行多种方式的尝试, 既可以把解析几何作为高等代数相关概念的例子, 也可以作为相关理论的应用; 既可以把解析几何分散到高等代数的各个章节中, 也可以作为高等代数的若干章节. 做这样不同的尝试是值得的, 因为同一问题可以有多种表现方式.
以下我们详细谈谈各个部分的具体衔接方式.
矢量代数: 内积
建立直角坐标系的目的是可以计算很多几何量, 例如矢量的长度、夹角、几何图形的面积和立体图形的体积等, 解析几何的很多概念都可以在这个过程中自然得出.
问题 1 在平面上选择坐标原点 和单位长度建立直角坐标系. 给定平面矢量
求 的夹角和它们张成的平行四边形面积.
设 为 的夹角, 利用余弦定理不难得到
注意到分子分母的各项具有类似的结构, 于是引入简洁的记号
称为 的内积. 从而有
故夹角 满足
特别地, 当且仅当 当且仅当 . 从几何上看, 与 是垂直的, 记作 .
继续计算可得以 和 为边的平行四边形面积为
化简后不难得到 , 即为行列式 的绝对值. 我们称该行列式为由 张成的平行四边形的有向面积. 这是二阶行列式的几何意义.
矢量代数: 外积
类似地, 我们可以在立体空间中选定坐标原点 和单位长度建立直角坐标系. 在刚开始讲授高等代数与解析几何这门课时, 我注意到一个问题: 在空间建立直角坐标系, 空间每一个点对应唯一的坐标, 一般的解析几何书上都默认不同点对应的坐标一定不一样, 这里或许有点想当然的成分, 是否可能有两个点的坐标是一样的, 例如两点的坐标都是 ? 或者说, 立体空间为什么是三维的? 这个问题看起来很显然, 然而细究一下就会发现问题: 早期的立体几何是没有坐标系和维数的概念的, 是什么因素限制了空间的维数? 这就需要立体几何的公理, 其中一条是: 任何两个不重合的平面如果有一个交点, 一定交于一条直线. 这实际上是线性空间的维数公式的特殊情形:
问题 2 设 为立体空间(空间矢量的全体), 是经过原点的不重合平面, , 则 且
现在我们可以来计算立体空间的矢量的夹角、平行四边形面积和平行六面体体积.
问题 3 设空间两个矢量为 , .
(1) 求 与 的夹角 ;
(2) 求 张成的平行四边形的面积.
类似于平面情形可得
为了简化可以引入记号
称为 的内积. 于是有
同样有 当且仅当 , 记作 .
我们同样可以得到以线段 和 为边的平行四边形的面积为
化简可得
于是 实际上是如下矢量
的长度. 当然, 这里的矢量有 种选择, 哪一个更好呢? 这就需要注意这些矢量的几何意义.
问题 4 若取
则 , 即 分别垂直于 . 称 为 与 的外积, 记为 .
当然 也与 垂直, 我们选择 很简单: 大多数人是右撇子, 而 构成右手系. 具体而言, 当右手大拇指指向 方向, 食指指向 方向, 则中指指向的方向就是 . 如果从行列式角度看, 称 为右手系当且仅当以这三个矢量为列向量的行列式是正的.
与通常的外积定义相比, 上述定义似乎更容易理解一些. 我们也可以用线性方程组求解的观点来解释 的选择(这时候应该回顾一下代数余子式和伴随矩阵).
问题 5 设 不共线(即线性无关), 则齐次线性方程组
的解空间是一维的, 其基础解系为
上述行列式的写法或许可以给我们一些启发. 记 , 则
于是
上式的右边从形式上看是一个行列式, 于是我们采用如下更容易记忆的公式.
矢量代数: 混合积
前面我们计算了空间两个矢量 的夹角和张成的平行四边形面积, 在此基础上可以考虑 张成的平行六面体的体积 .
设 , 我们已经得到 张成的平行四边形面积为 , 需要求 到该平行四边形的距离 . 这时候 的作用又显示出来了.
问题 6 若 与 的夹角为 , 则
于是我们可以计算出平行六面体体积了:
这时候行列式的定义又发挥作用了.
问题 7 张成的平行六面体体积为行列式 的绝对值.
该行列式也被称为平行六面体的有向体积, 记为 , 即
称为 的混合积. 容易得到
混合积有一个自然的应用.
问题 8 设 , 则 线性相关当且仅当 .
平面与直线方程
平面与直线的方程在中学时期已经接触过, 对学生来说难度应该不大. 在解析几何课中, 这部分内容基本是一章, 内容略显琐碎. 或许重要的是, 利用高等代数系统的理论知识去理解直线和平面的各个方面包括其各种方程. 我们先考虑平面方程.
角度一: 子空间和陪集. 空间中任何平面 都平行于一个过原点的平面 , 而 是 的一个子空间, 就是 的一个陪集 , 其中 是 中的任一点. 作为子空间, 我们只需要知道 的一组基, 设为 , 它们是平行于 的两个线性无关向量. 于是 中所有点为
从而 的参数方程为
其中 .
角度二: 线性相关性. 设 是平行于 的线性无关向量组, 给定 , 则 当且仅当 线性无关, 当且仅当 能被 线性表出. 这样也可以得到上述参数方程.
角度三: 行列式或混合积. 线性相关当且仅当这三个向量的混合积为零, 即以三者为行向量的行列式为零. 从而得到 的方程为
将上式展开得到平面 的一般方程
角度四: 内积与外积. 一般方程中的系数 对应于一个非零向量 . 这实际上就是 的外积, 从而与 垂直, 也就是与 垂直. 故称 为 的法向量. 于是, 当且仅当 与 垂直, 由此也能得到 的一般方程.
角度五: 线性方程(组)的解空间. 一般线性方程组 如果有解, 其解集 是 的解集 的陪集, 从几何上看, 是与 平行的. 对于空间的平面, 情况比较简单, 它是由一个线性方程 决定的, 只要 不全为零即可.
确定一个平面一般需要如下的条件: 三个不共线的点; 一条直线和直线外一点; 两条相交直线或两条平行直线. 这些条件本质上没有什么区别, 可以相互转化, 再利用上述的观点就可以, 例如:
问题 9 设 不共面, 它们确定的平面方程为
或更整齐一点:
平面上的直线与空间的平面有相似之处, 可以用陪集、线性相关性、行列式、内积和线性方程等不同角度来看, 这个比较简单, 略过. 值得一提的是空间的直线方程.
每条直线 都与一条过原点的直线平行, 后者的一组基为 , 则给定任意 可得 的参数方程为
用 与 线性相关也得到同样的方程.
上述方程用分量形式来表达就得到了直线的标准方程
上式中有两个等式, 每个等式都是一个线性方程, 从而是一个平面, 两个等式联立就是两个平面的交集. 于是直线的一般方程为
这就是一个线性方程组, 只要 与 不平行, 解集就是一条直线. 进一步, 注意到 分别是两个平面的法向, 它们的外积就是交线的方向.
关于直线和平面的其他问题如位置关系、距离等都可以用上面的一些想法解决, 当然有一些技巧性比较强的地方, 但这些不是核心问题. 从上面的思路可以看出, 在有一定的高等代数基础的情况下, 可以从多个层面看待解析几何的问题, 从而更容易理解一些深刻的问题.
二次曲线与二次曲面
中学讲过圆、椭圆、抛物线和双曲线的方程, 甚至有学生知道这些被称为圆锥曲线, 但他们不太可能理解这里的深层次原因, 因为这需要二次曲线的分类. 二次曲线和二次曲面的分类是解析几何的核心内容, 在教材中会花很大篇幅介绍. 如果与高等代数内容进行对比就会发现, 这些内容实际上是高等代数的二次型和正交变换的特殊情形. 立体几何自然是很好的二三维的例子, 不过在没有系统的理论知识做支撑, 单独介绍二三维情形很可能事倍功半, 语焉不详的理论介绍和比较复杂的矩阵计算难免让学生们顾此失彼, 无法真正理解核心思想.
我们考虑于一般的二次超曲面
其中 时分别对应二次曲线和二次曲面.
利用二次型理论可以把上述方程写成矩阵形式
其中 是对称矩阵, .
坐标变换会改变二次超曲面的方程. 什么样的变换可以把方程化得简单一些? 当然研究几何对象时所作的坐标变换不能改变几何体的形状, 至少是变换过程中要保持几何体上任意两点的距离不变, 这就自然引入了等距变换.
问题 10 (1) 平移和正交变换是等距变换;
(2) 等距变换的复合是等距变换.
于是对于任何等距变换 , 令 , 即该等距变换把坐标原点映到 . 考虑 , 其中 是平移变换. 于是 是保持原点不变的等距变换.
问题 11 设 为等距变换, 且 , 则 是正交变换. 从而任何等距变换都是平移和正交变换的复合.
我们现在可以利用矩阵技巧把二次超曲面的方程化简.
首先, 由于 是实对称矩阵, 故可以选择正交矩阵 使得
其次, 不妨设 为 的所有非零特征值, 则可做平移变换使得一次项 的系数为零.
再次, 若一次项 的系数不全为零, 则可作正交变换使得 的系数非零, 其他 的系数都是零.
最后, 如果有一次项系数非零, 则适当平移消除常数项.
经过上述过程的处理之后, 二次超曲面的方程就化为简单情形: 二次项只有平方项 而没有交叉项 , 一次项和常数项最多只有一项非零. 由此可以得到二次曲线和二次曲面的分类, 其中有意思的二次曲线只有椭圆(含圆)、双曲线和抛物线这三种, 有意思的二次曲面也只有九种, 包括二次锥面, 其特殊情形就是圆锥面.
利用分类结果就可以回答如下问题:
问题 12 平面与圆锥面(或一般的二次锥面)的交线都是二次曲线, 特别地, 椭圆、双曲线和抛物线都可以用平面与圆锥面相交得到.
进一步讨论各种二次曲面的性质只需要利用直线与二次曲面的位置关系即可, 详见我的教材. 值得一提的是, 在历史上, 正是由于对二次曲面分类的研究, 尤其是其中坐标轴的选择, 特征值、特征向量的概念才被引出来. 也就是说, 对于二次超曲面, 合适的坐标轴恰好就是二次项系数矩阵的特征向量. 这里又有一个遗留问题:
问题 13 要把二次超曲面的方程化成标准形, 需选择什么样的点作为坐标原点?
本套是南开大学代数类课程整体规划系列教材,把本科代数类课程打通,书籍编写过程中注意“历史途径法”的应用,让读者对代数类课程知识背景熟悉,对所学课程有整体的把握. 作者团队是天津市优秀教学团队,曾获南开大学教学成果