北大王杰教授：用数学分析动人音乐的奥秘（上） / 开普饭

编者按

当一串叮咚悦耳的乐符流过，你是否想过这和谐律动背后的数学原理？当徜徉在数学的星辰大海中，你是否曾捕捉到音乐之美的痕迹？音乐与数学，感性认知与理性逻辑的碰撞，交织着怎样的奇妙思考？

北京大学数学科学学院王杰教授自2016年秋季学期开始，开设“音乐与数学”课程，2018年该门课进入北大“通识教育核心课程”行列。今日，与您分享王杰老师撰写的科普文章《音乐与数学》（节选），带您一同探秘音乐中的数学，聆听数学课堂上的美妙旋律。(点击下方音乐，边听边看吧！)

通识课“音乐与数学”课堂照片

音乐与数学之间有什么关系？对于这个问题也许有人会回答：这两件事情毫不相干，怎么会有关系；也有人会回答：音乐和数学好像的确有些相似的地方。但是更多的人也许从来就没有想过这个问题。

司马迁在《史记》中有如下文字：

司马迁

律数：九九八十一以為宫。三分去一，五十四以為徵(zhǐ)。三分益一，七十二以為商。三分去一，四十八以為羽。三分益一，六十四以為角(jué)。黄鐘長八寸七分一，宫。大吕長七寸五分三分一。太蔟長七寸七分二，角。夾鐘長六寸一分三分一。姑洗長六寸七分四，羽。仲吕長五寸九分三分二，徵。蕤賓長五寸六分三分一。林鐘長五寸七分四，角。夷則長五寸四分三分二，商。南吕長四寸七分八，徵。無射長四寸四分三分二。應鐘長四寸二分三分二，羽。

生鐘分：子一分。丑三分二。寅九分八。卯二十七分十六。辰八十一分六十四。巳二百四十三分一百二十八。午七百二十九分五百一十二。未二千一百八十七分一千二十四。申六千五百六十一分四千九十六。酉一万九千六百八十三分八千一百九十二。戌五万九千四十九分三万二千七百六十八。亥十七万七千一百四十七分六万五千五百三十六。

从上面这些文字，应该可以看出音乐与数学之间是有着某种密切联系的。在上面引用的《史记》文字中，十二地支对应的那12个数目字如果用现代符号表示，是一个由分数构成的序列

为什么音律会与这样一些分数有关呢？这些都是所谓“律学”(temperament)研究的内容。事实上，历代文人学者，专家教授对于这些文字和数字做了无数的考证、校勘、研究乃至实验，所涉及的领域包括了音律学、数学、物理学等许多相关的学科领域。

毕达哥拉斯

古希腊学者毕达哥拉斯相信“万物皆数”(all things are numbers)。他认为数与几何图形、与音乐的和谐、与天体的运行等等都有密切关系，所谓“四艺”(quadrivium)就是算术、几何、音乐和天文。无独有偶，中国古代的“六艺”（礼、乐、射、御、书、数）同样包含了音乐和数学。毕达哥拉斯认为音乐是数的应用，是从属于数学的学科，因为宇宙和谐的基础是完美的数的比例。当乐器两根弦的长度比例是简单的整数比时，它们同时发出的声音是和谐的。例如两根弦的长度比等于2:1时，它们发出的声音构成八度音程；而当弦的长度比分别为3:2和4:3时，发出的声音构成完美协和的纯五度和纯四度音程。

近代以来的许多著名学者都认为音乐与数学之间存在着密切的联系。

莱布尼茨

莱布尼茨在1712年4月17日给哥德巴赫的信中写道：我们从音乐中得到的愉悦来源于计算，无意识地计算。音乐不过是无意识的算术。

西尔维斯特

英国数学家西尔维斯特在他的代数学论文中指出：难道不能把音乐描述成感知的数学，而把数学描述成推理的音乐？它们的灵魂是相同的！

迪厄多内

布尔巴基学派的重要成员迪厄多内曾经为非数学专业的人写过一本介绍数学的书，其英文译本的标题就是《数学——推理的音乐》。

♪ 1.和谐背后的数学 ♫

歌词滚动丨移出+展开动画

音乐追求和谐美。毕达哥拉斯大概是最早探究和谐奥秘的哲人之一。据说他路过铁匠铺，发现不同重量的铁锤同时敲击铁砧时，发出的声音有的好听，有的不好听。经过反复仔细的观察研究，毕达哥拉斯发现当铁锤的重量之比为3:4时，敲击铁砧发出的声音最和谐。这也成为毕达哥拉斯学派认定音乐的协和来源于简单的整数比的一个证据。当然，后来的研究者多数认为这只不过是一个传说，毕竟铁锤敲击铁砧发出声音的频率不是简单地由其重量就能够决定的。毕达哥拉斯的信念更多地来源于其哲学思考：声音的和谐与天体运行的和谐一样，都来源于数的和谐。下图取自一本十六世纪的书，它直观地描绘了古希腊哲学家对于宇宙的认识。在测弦器（monochord，也译作独弦琴）上，弦的右侧自下而上标着两个八度的音名A，B，...，G，a，b，...，g。而弦的左侧自下而上地标着“土、水、气、火”四种元素以及月亮、水星、金星、太阳、木星、土星等天体。在弦的右侧，虚线标出了四度、五度、八度、两个八度等音程，而在弦的左侧，虚线标出了相应的比例4:3、3:2、二倍、四倍等等。

统一天地万物和谐的测弦器 (monochord)

毕达哥拉斯关于协和音程的简单整数比是有科学根据的，但是在今天所谓“平均律”占主导地位的情形下，那些简单的整数比通常都不复存在了。唯一继续有效的是八度音程的频率比。

命题1 假定一个音的频率是f，则高八度的音的频率等于2f。

毕达哥拉斯还认识到了声音与弦长之间关系的规律：取一段琴弦的一半所发出的声音比整条琴弦所发出声音高一倍。随着科学的发展，到后来就有了更为精确的关于琴弦所发出声音频率的定理。

定理2（梅森定理）给定一根两端被固定的均匀细弦，设其长度为L，线密度为ρ，受到的张力为T，则这根弦发出声音的频率等于

梅森

梅森定律可以通过解一维振动方程得到。设一根长度为L的均匀细弦被固定在水平轴上(0,0)和(L,0)之间。设弦的线密度为ρ，受到的张力为T。再设u(x,t)是弦上x处在时刻t的位移。令

则这根弦产生的振动须满足一维振动方程

因为弦的两端（x=0,L）是固定的，所以u(x,t)还需要满足边值条件

最终得到方程的解是一个无穷级数

其中的a_n,b_n,θ_n都是常数。进一步，令ω=πc/L，则解的第一项等于

可见弦上的任意一点都依照正弦规律sin(ω₁t+θ₁)运动，其周期等于2π/ω₁，而其频率f₁等于周期的倒数。回忆常数c满足c²=T/ρ，即得

这就是著名的梅森定律。

进一步，振动方程的解u(x,t)是u_n(x,t)的无穷级数，这说明弦并非只在单一的频率上振动，而是无数个正弦振动的叠加。对于n=1,2,...，正弦振动u_n(x,t)称为这根弦的第n个振动模态(mode of vibration)，其振动频率为

序列{f₁,f₂,f₃,...}称为弦的固有频率(natural frequencies)。f₁称为基频(fundamental frequency)，相应的声音称为基音(fundamental note)。而f_n(n>1)所对应的声音统称为泛音(overtone)。显然，泛音的频率都是基频的整数倍。在音乐上通常把固有频率的序列

称为泛音列。

振动是产生声音的物理基础。振动方程的解告诉我们，无论是乐器还是人的嗓子，发出的都不是单一频率的声音。事实上，方程解是一个傅里叶级数，其中每一项u_n(x, t)中的系数

就是以nf₁为频率的泛音的振幅。人们之所以能够区分出乐器、人声等等的不同音色，其原因就是在于这些声音的各次泛音具有不同的振幅。

有了泛音列的概念，就可以解释为什么有些声音同时出现听上去和谐，有些却觉得不和谐。假设两个乐音的基频分别f₁和f₂。现在我们知道，实际的乐音包含了各自的泛音列

当第二个乐音比第一个高八度时，其基频f₂=2f₁，故其泛音列实际等于

显然这些泛音在第一个乐音的泛音列中都出现，即第二个泛音列是第一个的子列。在音乐效果上就是完全协和的。

如果第二个乐音比第一个高纯五度，按照毕达哥拉斯的理想比例，它们的基频应该满足

，故其泛音列实际等于

其中有一半的泛音在第一个泛音列中出现，即两个泛音列有一半的项是重合的，听上去的效果仍然是非常和谐的。

但是，如果第二个乐音比第一个高大二度，按照毕达哥拉斯的理论，第二个音的基频须满足

，则其泛音列等于

与第一个泛音列重合甚少，听上去的效果就很不和谐。这就是赫尔姆霍兹提出的，关于音程是否协和的一种解释：泛音列重合理论。

赫尔姆霍兹

需要指出的是，音程是否协和在很大程度上带有主观性。同一个音程，在不同的地区、不同的历史时期，对于不同民族、不同文化背景的人群，引起的感觉可能是不同的。因此要给协和音程(consonant)和不协和音程(dissonant)下一个科学客观的定义并不容易。正如欣德米特指出的：这两个概念从未被完整地解释过，而且在一千年里它们的定义总在变化。

♪ 2.如何给钢琴调音 ♫

现在大家通常见到的钢琴有88个键。下图引自This is your brain on music: the science of a human obsession。

钢琴键盘及其对应的频率

从图中可以清楚地看到，这88个键实际上是分成了七个组，每个组有7个白键和5个黑键，构成一个八度；再加上最右端（最高音）的一个白键和最左端（最低音）二白一黑的三个键。键盘上标出的字母C,D,E,F,G,A,B称作音名，也就是乐音的名字，它们是固定的。而我们通常熟悉的do, re, mi, fa, so, la, xi称为“唱名”。为了区分不同的八度，通常给音名添加下标。键盘最左边的键是A₀，它右边的第一组白键分别为C₁,D₁,...,A₁,B₁。最右端的白键是C₈，它左边的那一组白键从低到高分别为C₇,D₇,...,A₇,B₇。现在的问题是：图中每个键所对应的频率是如何确定的呢？这就是所谓“律学”要解决的问题。

其实无论是从实践的角度，还是从数学家的思维来看，确定每个键发出的频率（绝对音高）并不重要。重要的是确定同一个八度内不同键发出声音的振动频率之比（相对音高）。试想三五好友一起放歌，通常都是一人起头，众人相随。除非起歌的人受过良好的音乐训练，否则他起的那个音很可能根本不在钢琴的88个键所发出的任何一个音上。然而大家却能够从这个音出发，顺利地唱出整首歌来，因为只要后面的各个音相对音高正确，唱出来的歌听上去就是对的。从数学上看，相差八度的两个音，其频率比是2:1，所以只需要确定了1到2之间的各个音的频率比，就可以确定不同八度中各个音的相对频率。然后再确定某一个音的绝对音高（例如著名的国际标准——“音乐会音高”A4=440Hz），其他所有的音高就都确定了。这个道理毕达哥拉斯学派已经知道了，我们的古人也是明白的。

三分损益· 五度相生

管仲

大约完成于春秋战国时期（公元前770年—公元前221 年）的《管子》一书，记录了管仲及其学派的言行事迹。在《管子· 地员》中有如下记载：

凡將起五音，凡首，先主一而三之，四開以合九九，以是生黄鐘小素之首，以成宫。三分而益之以一，為百有八，為徵。不無有三分而去其乘，適足，以是生商。有三分，而復于其所，以是成羽。有三分，去其乘，適足，以是成角。

用现代语言表述，就是首先将1乘以3，这样反复做4次，得到3⁴=81，作为宫音的标准。然后先做“三分益一”，增加81的三分之一，得到108，对应于徵音。下一步做“三分损一”，相当于做108×2/3=72，得到商音。再做“三分益一”，得到羽音为72×4/3=96。最后再做“三分损一”，把96乘上2/3，得到角音的64。由于音高与弦长成反比，所以如果把这些数字看做是琴弦的长度，那么五音按照从低到高的次序排列应该是

徵羽宫商角

108 96 81 72 64

考虑这五个音之间的比例。音程“徵—宫”的比例为81/108=3:4，符合纯四度的简单整数比。高八度的徵音应该为108/2=54，宫音与它的比例为54/81=2:3，同样符合纯五度的简单整数比。音程“宫—商”的比例为72/81=8:9，与大二度的比值相符。不仅如此，音程“徵—羽”和“商—角”的比例也都符合大二度的比值。但是，音程“宫—角”的比例是64/81≈0.79，与大三度的比例4:5=0.8有所不符。

毕达哥拉斯学派认为音的协和来源于自然数的简单比值。除了同度音程1:1和八度音程2:1之外，纯五度音程对应的比例3:2是最简单的，因此就采用3:2作为生律的元素。假定音名C对应的频率为f，则其上方五度的G对应的频率应为

。而G上方五度音的频率应该是

，超出了同一个八度。因此将其降低一个八度，得到音名D对应的频率为

。然后继续按照上面的做法，每次用3/2去乘；如果得到的数大于2，超出了同一个八度，就再多乘一个1/2，直到产生全部十二个音名。因为只需要考虑相对音高，所以我们可以省略掉具有绝对音高意义的频率f，最终得到下图

毕达哥拉斯五度相生

五度相生得到的各律，其五度音程的频率比自然是理想的3:2，相应的四度音程比例也肯定是理想的4:3。但是与三分损益法生成的十二律一样。其大三度音程C—E的频率之比为

大于理想比例5:4=1.25；相应地，其大六度音程C—A，D—B的频率之比都是27/16=1.6875，大于理想比例5:3。

不仅如此，在得到音级F之后，如果继续考虑其上方纯五度的频率，

将其降低一个八度，得到这个音的频率为

另一方面，F上方五度是高八度的C'，降低八度得到的应该就是起始的音C。换言之，上式应该等于1才对！这个略大于1的数就是著名的毕达哥拉斯音差(Pythagorean comma)。

严格地讲，从♯A出发做五度相生。得到的音级应当是♯E，而非F。从♯E出发做五度相生，得到的音级是♯B，而非C。换言之，在五度相生律中，♯E和F并不是等音的，♯B和C也不是等音的！

纯律· 中庸全音律

不论是中国古代的三分损益还是毕达哥拉斯的五度相生，得出的大三度和大六度音程的频率比都不是简单的整数比。另一方面，从文艺复兴时期开始，西方音乐中越来越多地重视和使用三度和六度音程，于是人们逐步探索在五度相生法中添加一个生律元素：理想大三度的比例5:4，这就形成了纯律 (just intonation)。根据八度比例2:1和纯五度比例3:2和大三度比例5:4，直接可以得出纯四度的比例4:3 和大六度的比例5:3，于是得到下图中的结果。