多元函数的导数与微分
本文详细介绍了多元函数的导数与微分的基本概念和计算方法。首先定义了多元函数的偏导数,解释了全增量和偏增量的概念,并给出了偏导数的定义和计算方法。接着,讨论了高阶偏导数与混合偏导数,介绍了它们的定义和计算技巧,并证明了混合偏导数在一定条件下可以交换次序。随后,文章探讨了多元函数的全微分,定义了全微分的概念,并讨论了可微性与连续性、可微性与可导性的关系。文章还介绍了复合函数的求导法(链式法则),并通过实例说明了其应用。最后,讨论了隐函数求导法则、场的方向导数与梯度、多元函数的泰勒公式以及多元函数的极值与最值的求法,包括无条件极值和条件最值(拉格朗日乘数法)。通过本文的学习,读者可以全面掌握多元函数导数与微分的基本理论和计算技巧,为进一步研究和应用奠定坚实的基础。
(摘要由 OpenAI GPT 4o 生成)
多元函数的偏导数
偏导数的定义
全增量 Δz=f(x,y)−f(x0,y0)。
偏增量 Δxz=f(x,y)−f(x0,y);Δyz=f(x,y)−f(x,y0)。
定义 设二元函数 z=f(x,y) 在点 (x0,y0) 的某个邻域内有定义,若极限
Δx→0limΔxΔz=Δx→0limΔxf(x0+Δx,y0)−f(x0,y0)=x→x0limx−x0f(x,y0)−f(x0,y0)
存在,则称此极限为函数 z=f(x,y) 在点 (x0,y0) 处对 x 的偏导数,记作 fx′(x0,y0) 或 ∂x∂f(x0,y0) 或 zx′(x0,y0) 或 ∂x∂z(x0,y0)。
否则称函数 z=f(x,y) 在点 (x0,y0) 处对 x 的偏导数不存在。
对 y 的偏导数定义类似。
如果二元函数 z=f(x,y) 在区域 G 上的每一点 (x,y) 极限 Δx→0limΔxΔz 都存在,则称 f(x,y) 在 G 上对 x 可导,称通过此极限得到的关于 x,y 的函数为函数 z=f(x,y) 对 x 的偏导函数,记作 fz′(x,y) 或 ∂x∂f(x,y)。
计算对 x 的偏导函数时,根据偏导数的定义,这等价于:将 y 视为常数,在得到的关于 x 的一元函数中对 x 求导。
因此,一元函数的求导法则可以直接应用于多元函数的偏导数的计算。
计算二元函数 z=f(x,y) 在点 (x0,y0) 处对 x 的偏导数时,可以先代入 y=y0,得到一元函数 z=f(x,y0),再对 x 求导,从而简化计算。
高阶偏导数与混合偏导数
二元函数的偏导数仍然是二元函数,因此可以继续对其求偏导数。假设二元函数 z=f(x,y) 的一阶偏导函数 ∂x∂z 、∂y∂z 都存在,则可以继续对其求偏导数,得到二阶偏导数:
∂x∂∂x∂z∂y∂∂x∂z∂x∂∂y∂z∂y∂∂y∂z
依次记作:
∂x2∂2z∂x∂y∂2z∂y∂x∂2z∂y2∂2z
或者
fxx′′(x,y)fxy′′(x,y)fyx′′(x,y)fyy′′(x,y)
定理 若二元函数 z=f(x,y) 的二阶偏导数 fxy′′(x,y) 和 fyx′′(x,y) 都在 (x0,y0) 处连续,则有 fxy′′(x0,y0)=fyx′′(x0,y0)。
证明.
由于 fxy′′(x,y)、fyx′′(x,y) 在 (x0,y0) 处连续,因此这两个函数在 (x0,y0) 的邻域内有定义,取充分小的 Δx,Δy(Δx,Δy 均不为 0),可以使得 (x0+Δx,y0)、(x0,y0+Δy)、(x0+Δx,y0+Δy) 三点均在 (x0,y0) 的邻域内。
令 φ(x)=f(x,y0+Δy)−f(x,y0),ψ(y)=f(x0+Δx,y)−f(x0,y)。
对 φ(x) 使用拉格朗日中值定理,有 φ(x)=fy′(x,y0+θ1Δy)Δy,其中 θ1∈(0,1)。
Note
此处拉格朗日中值定理适用的原因是:对于每一个固定的 x,关于 y 的一元函数 f(x,y) 在闭区间 y∈[y0,y0+Δy] 上连续且在开区间 y∈(y0,y0+Δy) 可导。
由于 f(x,y) 在点 (x0,y0) 处二阶可导,必然存在一个邻域,使得 f(x,y) 在该邻域内一阶可导。
同理,对 ψ(y) 使用拉格朗日中值定理,有 ψ(y)=fx′(x0+θ2Δx,y)Δx,其中 θ2∈(0,1)。
考虑
W=f(x0+Δx,y0+Δy)−f(x0+Δx,y0)−f(x0,y0+Δy)+f(x0,y0)
有 W=φ(x0+Δx)−φ(x0)=ψ(y0+Δy)−ψ(y0)。
对 φ(x0+Δx)−φ(x0) 使用一元函数的拉格朗日中值定理,得到 φ(x0+Δx)−φ(x0)=φx′(x0+θ3Δx)Δx,其中 θ3∈(0,1)。
Note
此处拉格朗日中值定理适用的原因是:φ(x)=fy′(x,y0+θ1Δy)Δy
由于 f(x,y) 在点 (x0,y0) 处二阶可导,必然存在一个邻域,使得 f(x,y) 在该邻域内一阶偏导数连续可导。
整理可得:W=fyx′′(x0+θ3Δx,y0+θ1Δy)ΔyΔx。
同理,对 ψ(y0+Δy)−ψ(y0) 使用一元函数的拉格朗日中值定理,得到 ψ(y0+Δy)−ψ(y0)=ψy′(y0+θ4Δy)Δy,其中 θ4∈(0,1)。
整理可得:W=fxy′′(x0+θ2Δx,y0+θ4Δy)ΔyΔx。
因此,有 fxy′′(x0+θ2Δx,y0+θ4Δy)=fyx′′(x0+θ3Δx,y0+θ1Δy)=A。
当 Δx→0,Δy→0 时,有 A=fxy′′(x0+θ2Δx,y0+θ4Δy)→fxy′′(x0,y0)。因为 fxy′′(x,y) 在 (x0,y0) 处连续,所以 A=fxy′′(x0,y0)。
同理,A=fyx′′(x0,y0)。
因此,fxy′′(x0,y0)=fyx′′(x0,y0)。■
同理可证,对于更高维度的多元函数和更高的求导阶数,只要偏导函数在 (x0,y0,…) 处连续,那么混合偏导的值与求导的顺序无关。
多元函数的全微分
一元函数的微分
若 Δy=f(x0+Δx)−f(x0)=A⋅Δx+ο(Δx),称函数 f(x) 在 x0 可微,A⋅Δx 为该点的微分,用记号 dy 表示。
我们探究一元函数中可微和可导的关系:
若函数 y=f(x) 在 x0 处可微,则在 x0 处,有 Δy−A⋅Δx=ο(Δx),即 Δx→0limΔxΔy−A⋅Δx=0,也即 Δx→0limΔxΔy=A。这恰好是函数 y=f(x) 在 x0 处导数值的定义。
因此,一元函数在某点可微和在该点可导是等价的。
多元函数的全微分
定义 若二元函数 z=f(x,y) 在点 (x0,y0) 处的全增量 Δz=f(x0+Δx,y0+Δy)−f(x0,y0) 可表示为
Δz=AΔx+BΔy+ο(ρ)(ρ:=(Δx)2+(Δy)2, Δx, Δy→0)
并且 A、B 与 Δx、Δy 无关,称函数 z=f(x,y) 在点 (x0,y0) 处可微,AΔx+BΔy 为该点的全微分,用记号 dz 表示。
Note
上式 Δz=AΔx+BΔy+ο(ρ) 存在若干种等价形式,包括不涉及 Δx、Δy 的形式,此处不一一列举。
定理 若二元函数 z=f(x,y) 在点 (x0,y0) 处可微,则有二元函数 z=f(x,y) 在点 (x0,y0) 处连续。(可微一定连续)
证明.
x→x0y→y0limf(x,y)=Δx→0Δy→0limf(x0+Δx,y0+Δy)=Δx→0Δy→0lim(Δz+f(x0,y0))=Δx→0Δy→0lim(AΔx+BΔy+ο(ρ))+f(x0,y0)=f(x0,y0)■
定理 若二元函数 z=f(x,y) 在点 (x0,y0) 处可微,则 z=f(x,y) 在点 (x0,y0) 处的两个偏导数 fx′(x0,y0),fy′(x0,y0) 均存在,且有 fx′(x0,y0)=A,fy′(x0,y0)=B。(可微一定可导)
证明.
由于 z=f(x,y) 在点 (x0,y0) 处可微,因此有 Δz=AΔx+BΔy+ο(ρ)。令 Δy=0,则有 Δz=AΔx+ο(∣Δx∣),以及 Δz=f(x0+Δx,y0)−f(x0,y0)=Δxz。
因此:
fx′(x0,y0)=Δx→0limΔxΔxz=Δx→0limΔxAΔx+ο(∣Δx∣)=A
同理,令 Δx=0,有 fy′(x0,y0)=B。■
然而,可导不一定可微。例如,函数 f(x,y)=∣x∣+∣y∣ 在点 (0,0) 处可导,但不可微。
例如函数 f(x,y)=⎩⎨⎧x2+y2xy,0,(x,y)=(0,0)(x,y)=(0,0),在点 (0,0) 处的偏导数:
fx′(0,0)fy′(0,0)=h→0limhf(h,0)−f(0,0)=h→0limhh20−0=0=h→0limhf(0,h)−f(0,0)=h→0limhh20−0=0
而在点 (0,0) 处,极限
x→0y→0lim(x−0)2+(y−0)2[f(x,y)−0]−[fx′(0,0)⋅(x−0)+fy′(0,0)⋅(y−0)]=x→0y→0limx2+y2x2+y2xy−0=x→0y→0lim(x2+y2)3/2xy
选取路径 y=x,有 x→0y→0lim(x2+y2)3/2xy=x→0lim(2x2)3/2x2=23/2x1→∞;
选取路径 y=x2,有 x→0y→0lim(x2+y2)3/2xy=x→0lim(1+x2)3/21=1。
从而上述二重极限不存在,因此函数 f(x,y) 在点 (0,0) 处不可微。
判断二元函数在某点是否可微的一般方法
根据微分的定义:
- 计算偏导数 fx′(x0,y0),fy′(x0,y0) 是否存在(先排除简单的微分不存在的情况,同理可以通过判断连续性排除一些情况);
- 如果偏导数存在,计算极限 Δx→0Δy→0lim(Δx)2+(Δy)2Δz−fx′(x0,y0)Δx−fy′(x0,y0)Δy 是否为 0。
定理 如果二元函数 z=f(x,y) 的偏导数 fx′(x,y),fy′(x,y) 在点 (x0,y0) 处连续,则 z=f(x,y) 在点 (x0,y0) 处可微。(可微的充分条件)
证明.
Δz=f(x0+Δx,y0+Δy)−f(x0,y0)=f(x0+Δx,y0+Δy)−f(x0+Δx,y0)+f(x0+Δx,y0)−f(x0,y0)=fy′(x0+Δx,y0+θ1Δy)Δy+fx′(x0+θ2Δx,y0)Δx(θ1,θ2∈(0,1))
由于 fx′(x,y),fy′(x,y) 在点 (x0,y0) 处连续,因此有 Δx→0Δy→0limfy′(x0+Δx,y0+θ1Δy)=fy′(x0,y0),Δx→0Δy→0limfx′(x0+θ2Δx,y0)=fx′(x0,y0)。
有 fy′(x0+Δx,y0+θ1Δy)=fy′(x0,y0)+ο(Δx,Δy),fx′(x0+θ2Δx,y0)=fx′(x0,y0)+ο(Δx,Δy)。
因此 Δz=fy′(x0,y0)Δy+fx′(x0,y0)Δx+ο(Δx,Δy)Δx+ο(Δx,Δy)Δy。
而
Δx→0Δy→0lim(Δx)2+(Δy)2ο(Δx,Δy)Δx+ο(Δx,Δy)Δy=0+0=0
因此 Δz=fy′(x0,y0)Δy+fx′(x0,y0)Δx+ο(ρ),即 z=f(x,y) 在点 (x0,y0) 处可微。■
在上面的式子中,由全微分的定义 dz:=AΔx+BΔy,有
dz=∂x∂zdx+∂y∂zdy
定理 若 P(x,y) 和 Q(x,y) 的偏导数存在且连续,则微分式 dz=P(x,y)dx+Q(x,y)dy 是某个函数的全微分的充要条件是 ∂y∂P=∂x∂Q。
证明.
充分性(⇒):设 dz=P(x,y)dx+Q(x,y)dy 是函数 f(x,y) 的全微分,那么
∂y∂P=∂y∂∂x∂f=∂x∂y∂2f∂x∂Q=∂x∂∂y∂f=∂y∂x∂2f
由 P(x,y) 和 Q(x,y) 的偏导数连续,从而 ∂x∂y∂2f 和 ∂y∂x∂2f 也是连续函数,连续的混合偏导数可以交换次序,因此 ∂x∂y∂2f=∂y∂x∂2f,从而 ∂y∂P=∂x∂Q。
必要性(⇐):设 ∂y∂P=∂x∂Q=g(x,y),只需要证明对 g(x,y) 的二重积分 ∫∫g(x,y)dxdy 和 ∫∫g(x,y)dydx 的结果相同,这样就能够找到全微分恰为 dz=P(x,y)dx+Q(x,y)dy 的函数 f(x,y)。
由充分性和必要性,得证。■
复合函数求导法(链式法则)
定理 若二元函数 z=f(u,v)=f(φ(x,y),ψ(x,y)) 在点 (u,v)=(φ(x,y),ψ(x,y)) 处可微,并且函数 u=φ(x,y) 和 v=ψ(x,y) 在点 (x,y) 的偏导数都存在,则复合函数 z=f(φ(x,y),ψ(x,y)) 在点 (x,y) 处的偏导数都存在,并且有:(链式法则)
∂x∂z∂y∂z=∂u∂z∂x∂u+∂v∂z∂x∂v=∂u∂z∂y∂u+∂v∂z∂y∂v
证明. 由于 z=f(u,v) 在点 (u,v)=(φ(x,y),ψ(x,y)) 处可微,因此 z 在点 (u,v) 处的全增量
Δz=∂u∂zΔu+∂u∂zΔv+ε1Δu+ε2Δv
其中 Δu→0Δv→0limε1=0,Δu→0Δv→0limε2=0。
展开有
f(φ(x′,y′),ψ(x′,y′))−f(φ(x,y),ψ(x,y))=∂u∂z(φ(x′,y′)−φ(x,y))+∂v∂z(ψ(x′,y′)−ψ(x,y))+ε1Δu+ε2Δv
作换元 {φ(x′,y′)−φ(x,y)=φ(x+Δx,y)−φ(x,y)ψ(x′,y′)−ψ(x,y)=ψ(x,y+Δy)−ψ(x,y),有
f(φ(x+Δx,y),ψ(x+Δx,y))−f(φ(x,y),ψ(x,y))Δxz=∂u∂zφ(x+Δx,y)−φ(x,y)+∂v∂zψ(x,y+Δy)−ψ(x,y)+ε1Δu+ε2Δv=∂u∂zΔxu+∂v∂zΔxv+ε1Δu+ε2Δv
当 Δx→0 时,有 Δu→0,Δv→0,因此 Δx→0limε1=0,Δx→0limε2=0。
因此:
∂x∂z=Δx→0limΔxΔxz=Δx→0limΔx∂u∂zΔxu+∂v∂zΔxv+ε1Δu+ε2Δv=∂u∂zΔx→0limΔxΔxu+∂v∂zΔx→0limΔxΔxv+0+0
又因为函数 u=φ(x,y) 和 v=ψ(x,y) 在点 (x,y) 的偏导数都存在,因此有 Δx→0limΔxΔxu=∂x∂u,Δx→0limΔxΔxv=∂x∂v。
从而 ∂x∂z=∂u∂z∂x∂u+∂v∂z∂x∂v。对 ∂y∂z 同理。■
链式法则的图示法
链式法则可以用下图表示:

Note
复合函数的偏导,需要区分先代入后求导,或是先求导后代入。采用某些表达时,可能会造成歧义。
例如,表达式 fx′(x,2x) ,如果未加以说明,难以区分是下面两种情况的哪一种:
- 先在 f(x,y) 中代入 (x,2x),然后对 x 求导,即 dxd[f(x,2x)];
- 先对 f(x,y) 求 x 的偏导,然后再偏导函数 fx′(x,y) 中代入 (x,2x),即 f1′(x,2x)。
为了消歧义:
对 (1) 使用重命名,令 z=f(x,2x),然后使用 dxdz ;
对 (2) 使用下标 _i 来表示对多元函数的第 i 个变量求导。
同样地,对复合函数 u=F(x+y,xy) ,符号 ∂x∂F 可能会产生歧义:是 (1) 代入 (x+y,xy) 之后,F 对 x 的偏导数 或是 (2) F 对其第一个变量 x+y 的偏导数,然后代入 (x+y,xy)。按上面的方法,使用:
- ∂x∂u 表示复合函数 u(x,y) 对变量 x 的偏导数:
- ∂x∂u=∂x∂F(x+y,xy)
- F1′ 表示 F 对其第一个变量的偏导数:
- F1′=∂(x+y)∂F(x+y,xy)=∂(x+y)∂u
全微分的一阶形式不变性
定理 若以 x,y 为自变量的二元函数 z=f(x,y) 可微,且 z=f(x,y),x=x(u,v),y=y(u,v) 都具有连续偏导数,则复合函数 z=f(x(u,v),y(u,v)) 在点 (u,v) 处具有连续偏导数(从而可微)并且有 dz=∂u∂zdu+∂v∂zdv。
证明.
dz=∂x∂zdx+∂y∂zdy=∂x∂z(∂u∂xdu+∂v∂xdv)+∂y∂z(∂u∂ydu+∂v∂ydv)=(∂x∂z∂u∂x+∂y∂z∂u∂y)du+(∂x∂z∂v∂x+∂y∂z∂v∂y)dv=∂u∂zdu+∂v∂zdv
这指出求微分对任何的 (△,□) 都能得到相同形式的结果,无论 {△=x□=y 还是多么复杂的表达式。
d (expr)=∂△∂(expr)d△+∂□∂(expr)d□
这也是可以对一个等式两边求全微分的依据。
隐函数求导法则
由单个方程确定的隐函数
方程 F(x,y,z)=0 确定隐函数 z=z(x,y) ⇔ F(x,y,z(x,y))≡0。
定理 设函数 F(x,y,z) 在点 P0(x0,y0,z0) 的某个邻域内存在连续偏导数, 且 F(x0,y0,z0)=0,Fz′(x0,y0,z0)=0,那么方程 F(x,y,z)=0 在点 P0(x0,y0,z0) 的某个邻域内始终能够唯一确定隐函数 z=f(x,y),且这个隐函数具有连续偏导数,满足 z0=f(x0,y0) 以及 ∂x∂z=−Fz′Fx′、∂y∂z=−Fz′Fy′。(隐函数存在定理)
证明.
对 F(x,y,z(x,y))≡0 两边对 x 求偏导数,应用复合函数的求导法则,有 Fx′∂x∂x+Fz′∂x∂z=0,因而 ∂x∂z=−Fz′Fx′。这里 Fz′ 能够放在分母的位置是由于在 P0 点连续函数 Fz′(P0)=0,这样就能够保证在 P0 点某邻域内 Fz′ 不为 0。
对 y 同理,有 ∂y∂z=−Fz′Fy′。
偏导数 ∂x∂z、∂y∂z 在 P0 点连续是因为连续函数的四则运算结果仍然是连续函数。■
实际的应用中,求解隐函数的偏导数时,通常也是直接对方程两边求偏导数,然后解方程。(或者也可以通过两边取全微分)
(*)由方程组确定的隐函数组
方程组 {F(x,y,u,v)=0G(x,y,u,v)=0 确定隐函数组 {u=u(x,y)v=v(x,y) ⇔ {F(x,y,u(x,y),v(x,y))≡0G(x,y,u(x,y),v(x,y))≡0。
定理 设函数 F(x,y,u,v),G(x,y,u,v) 在点 P0(x0,y0,u0,v0) 的某个邻域内存在连续偏导数, 且 {F(x0,y0,u0,v0)=0G(x0,y0,u0,v0)=0,并且二阶雅可比行列式 J=∂(u,v)∂(F,G)=∂u∂F∂u∂G∂v∂F∂v∂G=0,那么方程组 {F(x,y,u,v)=0G(x,y,u,v)=0 在点 P0(x0,y0,u0,v0) 的某个邻域内始终能够唯一确定隐函数组 {u=u(x,y)v=v(x,y),且它们具有连续偏导数,满足 {u0=u(x0,y0)v0=v(x0,y0) 以及
∂x∂u=−∂(u,v)∂(F,G)∂(x,v)∂(F,G)∂x∂v=−∂(u,v)∂(F,G)∂(u,x)∂(F,G)∂y∂u=−∂(u,v)∂(F,G)∂(y,v)∂(F,G)∂y∂v=−∂(u,v)∂(F,G)∂(u,y)∂(F,G)
证明. 对方程组两边同时对 x 求偏导数,有
⎩⎨⎧∂x∂F+∂u∂F∂x∂u+∂v∂F∂x∂v=0∂x∂G+∂u∂G∂x∂u+∂v∂G∂x∂v=0
整理可得
∂u∂F∂u∂G∂x∂u+∂v∂F∂v∂G∂x∂v=−∂x∂F∂x∂G
运用克莱姆法则解关于 (∂x∂u,∂x∂v) 的线性方程组,有:
⎩⎨⎧∂x∂u=∂u∂F∂u∂G∂v∂F∂v∂G−∂x∂F∂x∂G∂v∂F∂v∂G=−∂(u,v)∂(F,G)∂(x,v)∂(F,G)∂x∂v=∂u∂F∂u∂G∂v∂F∂v∂G−∂u∂F∂u∂G∂x∂F∂x∂G=−∂(u,v)∂(F,G)∂(u,x)∂(F,G)
对 y 求偏导的情况类似;有关解的存在性的证明、连续性的证明与由单个方程确定的隐函数类似。■
(*)场的方向导数与梯度
数量场的方向导数
设数量场 u(x,y,z) 在点 P0(x0,y0,z0) 的某邻域 U(P0)⊂R3 有定义,l 是与 x 轴正向夹角为 α,与 y 轴正向夹角为 β,与 z 轴正向夹角为 γ 的单位向量,P(x,y,z) 是 U(P0) 内满足 P0P=λl (λ>0)的任意一点,那么称
λ→0limλu(P)−u(P0)=λ→0limλΔlu
为数量场 u(x,y,z) 在点 P0 沿方向 l 的方向导数,记作 ∂l∂uP0。
可微 ⇒ 任意方向的方向导数存在,有以下定理:
定理 若函数 u(x,y,z) 在点 P0(x0,y0,z0) 可微,则函数 u(x,y,z) 在点 P0 沿任意方向 l 的方向导数存在,且有
∂l∂uP0=∂x∂uP0cosα+∂y∂uP0cosβ+∂z∂uP0cosγ
其中 α,β,γ 分别是 l 与 x,y,z 轴正向的夹角(即 ∣l∣l=(cosα,cosβ,cosγ))。
证明.
由于函数 u(x,y,z) 在点 P0 可微,因此对于 U(P0) 内满足 P0P=λl (λ>0)的任意一点 P(x,y,z),都有
⎩⎨⎧u(P)−u(P0)=u(x0+Δx,y0+Δy,z0+Δz)−u(x0,y0,z0)=ΔuΔu=∂x∂uP0Δx+∂y∂uP0Δy+∂z∂uP0Δz+ο((Δx)2+(Δy)2+(Δz)2)(Δx)2+(Δy)2+(Δz)2Δx=cosα(Δx)2+(Δy)2+(Δz)2Δy=cosβ(Δx)2+(Δy)2+(Δz)2Δz=cosγ
因此
Δx→0Δy→0Δz→0lim(Δx)2+(Δy)2+(Δz)2Δu=∂x∂uP0cosα+∂y∂uP0cosβ+∂z∂uP0cosγ
由于当 Δx→0,Δy→0,Δz→0 时,λ→0,因此有
∂l∂uP0=λ→0limλΔu=Δx→0Δy→0Δz→0lim(Δx)2+(Δy)2+(Δz)2Δu=∂x∂uP0cosα+∂y∂uP0cosβ+∂z∂uP0cosγ■
任意方向方向导数存在 ⇏ 连续;任意方向方向导数存在 ⇏ 可微,例如函数 u(x,y)={1,0,0<x<y2otherwise,在点 (0,0) 处不连续,不可微,但在点 (0,0) 处沿任意方向的方向导数都存在。
取路径上任意一点都满足 0<x<y2 的路径,(x,y)→(0,0)limu(x,y)=1;取路径上任意一点都不满足 0<x<y2 的路径,(x,y)→(0,0)limu(x,y)=0。从而极限不存在,从而函数在点 (0,0) 处不连续。因此函数在 (0,0) 处不可微。
而函数 u(x,y) 在 (0,0) 处沿着任意方向的方向导数 λ→0limλu(λcosα,λsinα)−u(0,0)=λ→0limλ0−0=0。
Note
考虑 x=λcosα>0 时,总是可以取 λ 足够小,使得 λ<sin2αcosα(由于 λ 和 α 相互独立,而 α 是确定的),从而 λcosα>(λsinα)2,从而 u(λcosα,λsinα)=0。
Note
此处不能使用偏导数均存在来论证函数沿各方向的方向导数存在。
任意方向方向导数存在 ⇏ 偏导数均存在。例如函数 u(x,y)=x2+y2,该函数在 (0,0) 处的偏导数均不存在,但函数在 (0,0) 处沿任意方向的方向导数都存在:λ→0limλu(λcosα,λsinα)−u(0,0)=λ→0limλλ=1。
Note
对于不可微的函数,不一定满足 ∂l∂uP0=∂x∂uP0cosα+∂y∂uP0cosβ。这是为什么这个函数在 (0,0) 处任意方向的方向导数都存在,但偏导数不存在的原因。
在几何意义上,沿 x 轴正方向的方向导数和函数对 x 的偏导数也是不同的。前者只要求从一个方向逼近时的切线斜率(单侧极限),而后者要求两个方向逼近时的切线斜率都要相同(左右极限相同)。
各个偏导数均存在 ⇏ 所有方向导数存在。例如函数 u(x,y)={1,0,x⋅y=0otherwise,在点 (0,0) 处所有偏导数均存在,但函数在 (0,0) 处沿不平行于任意坐标轴的方向的方向导数不存在。
数量场的梯度
∂l∂uP0=∂x∂uP0cosα+∂y∂uP0cosβ+∂z∂uP0cosγ=(∂x∂uP0,∂y∂uP0,∂z∂uP0)⋅(cosα,cosβ,cosγ)=(∂x∂u,∂y∂u,∂z∂u)P0⋅(cosα,cosβ,cosγ)
定义 ∇u:=(∂x∂u,∂y∂u,∂z∂u) 为函数 u(x,y,z) 的梯度(函数),∇u(P0) 为函数 u(x,y,z) 在点 P0 处的梯度(值)。从而 ∂l∂uP0=∇u(P0)⋅el,其中 el=(cosα,cosβ,cosγ) 是与 l 同方向的单位向量。
由 ∂l∂uP0=∇u(P0)⋅el=∣∇u(P0)∣cosθ,其中 θ 是 ∇u(P0) 与 l 的夹角,知 ∇u(P0) 的方向是函数 u(x,y,z) 在点 P0 处方向导数最大的方向(此时 cosθ=1),该方向导数的值为 ∣∇u(P0)∣。
多元函数的泰勒公式
定理 若函数 u=f(x,y) 在点 P0(x0,y0) 的某邻域 U(P0) 内具有 n+1 阶连续偏导数,则有(多元函数的泰勒定理)
f(x0+h,y0+k)=f(x0,y0)+(h∂x∂+k∂y∂)f(x0,y0)+2!1(h∂x∂+k∂y∂)2f(x0,y0)+3!1(h∂x∂+k∂y∂)3f(x0,y0)+⋯+n!1(h∂x∂+k∂y∂)nf(x0,y0)+(n+1)!1(h∂x∂+k∂y∂)n+1f(x0+θh,y0+θk)
其中,θ∈(0,1),(h∂x∂+k∂y∂)n 按多项式展开,例如 (h∂x∂+k∂y∂)2=h2∂x2∂2+2hk∂x∂y∂2+k2∂y2∂2(连续的混合偏导数可以交换求偏导的顺序)。
证明.
设 ψ(t)=f(x0+th,y0+tk),则 ψ(0)=f(x0,y0),ψ(1)=f(x0+h,y0+k)。
ψ′(t)=ψ′′(t)=ψ(n)(t)=dtdf(x0+th,y0+tk)……=(h∂x∂+k∂y∂)f(x0+th,y0+tk)=(h∂x∂+k∂y∂)2f(x0+th,y0+tk)=(h∂x∂+k∂y∂)nf(x0+th,y0+tk)
由一元函数的泰勒定理,存在 θ∈(0,1),使得
ψ(1)=ψ(0)+1!1ψ′(0)⋅(1−0)1+2!1ψ′′(0)⋅(1−0)2+⋯+n!1ψ(n)(0)⋅(1−0)n+(n+1)!1ψ(n+1)(θ)⋅(1−0)n+1=ψ(0)+1!1ψ′(0)+2!1ψ′′(0)+⋯+n!1ψ(n)(0)+(n+1)!1ψ(n+1)(θ)
将上述 ψ(t)(m) 全部代入一元函数的泰勒定理,即得
f(x0+h,y0+k)=f(x0,y0)+(h∂x∂+k∂y∂)f(x0,y0)+2!1(h∂x∂+k∂y∂)2f(x0,y0)+⋯+n!1(h∂x∂+k∂y∂)nf(x0,y0)+(n+1)!1(h∂x∂+k∂y∂)n+1f(x0+θh,y0+θk)■
令 n=0,即可得到二元函数的拉格朗日中值定理:
f(x0+h,y0+k)−f(x0,y0)=hfx′(x0+θh,y0+θk)+kfy′(x0+θh,y0+θk)
其中 θ∈(0,1)。可以用此定理证明一个二元函数在某个区域 G 内是否是仅关于 x 或 y 或常值的函数。
多元函数的极值与最值
多元函数的无条件极值
定义 设函数 z=f(x,y) 在点 P0(x0,y0) 的某邻域 U(P0) 内有定义,如果对于 U(P0) 内任意点 (x,y),都有 f(x,y)≤f(x0,y0),则称 f(x0,y0) 是函数 f(x,y) 在点 P0 的一个极大值;如果对于 U(P0) 内任意点 (x,y),都有 f(x,y)≥f(x0,y0),则称 f(x0,y0) 是函数 f(x,y) 在点 P0 的一个极小值。极大值和极小值统称为极值。取极大值和极小值的点称为极值点。
定理 如果函数 z=f(x,y) 在点 P0(x0,y0) 存在偏导数,且在点 P0 取得极值,那么 fx′(x0,y0)=0,fy′(x0,y0)=0。(极值的必要条件,满足条件 fx′(x0,y0)=0,fy′(x0,y0)=0 的点被称为 驻点)
证明. 证明极大值的情况,极小值类似:
根据定义,存在某邻域 U(P0),使得对于 U(P0) 内任意点 (x,y),都有 f(x,y)≤f(x0,y0)。由于偏导数 fx′(x0,y0) 存在,假设偏导数的值为 A=0,对于任意给定正数 ε,不妨令其为 ∣A∣,都应当存在 δ>0,使得当 0<∣Δx∣<δ 时,有
Δxf(x0+Δx,y0)−f(x0,y0)−A≤εA−∣A∣≤Δxf(x0+Δx,y0)−f(x0,y0)≤A+∣A∣f(x0+Δx,y0)−f(x0,y0)A−∣A∣≤Δx1≤f(x0+Δx,y0)−f(x0,y0)A+∣A∣
这是不可能满足的,因为这个不等式要求当 0<∣Δx∣<δ 时,Δx1 非负(或者非正,取决于具体的 A). 因此 A=0,即 fx′(x0,y0)=0。同理可证 fy′(x0,y0)=0。■
定理 设函数 z=f(x,y) 在点 P0(x0,y0) 的某邻域 U(P0) 内连续、且具有二阶连续偏导数,如果有 fx(x0,y0)=0,fy(x0,y0)=0,并且 A=fxx′′(x0,y0),B=fxy′′(x0,y0),C=fyy′′(x0,y0) 满足:(极值的充分条件)
- ABBC>0,则点 P0 是函数 f(x,y) 的极值点,且是极大值点或极小值点,取决于 A 的正负性(或 C 的正负性,这两项在这个条件下必然同号):
- 若 A>0,则 P0 是极小值点;
- 若 A<0,则 P0 是极大值点;
- ABBC<0,则点 P0 不是函数 f(x,y) 的极值点;
- ABBC=0,不能断定点 P0 是否是函数 f(x,y) 的极值点。
证明. 泰勒展开至 2 阶导数,对 U(P0) 内任意的点 P(x0+h,y0+k),存在 θ∈(0,1),使得
f(x0+h,y0+k)=f(x0,y0)+(h∂x∂+k∂y∂)f(x0,y0)+2!1(h∂x∂+k∂y∂)2f(x0+θh,y0+θk)=f(x0,y0)+2!1(h∂x∂+k∂y∂)2f(x0+θh,y0+θk)
当 h→0,k→0 时,有 x0+θh→x0,y0+θk→y0,由于 f(x,y) 在点 P0 处连续,因此有 f(x0+θh,y0+θk)→f(x0,y0)。此时有
f(x0+h,y0+k)−f(x0,y0)∼2!1(h∂x∂+k∂y∂)2f(x0,y0)=2!1(h2fxx′′(x0,y0)+2hkfxy′′(x0,y0)+k2fyy′′(x0,y0))=(Ah2+2Bhk+Ck2)=[hk][ABBC][hk]
根据极限的保号性和二次型的正定性,可以得到结论:
(1) 当二次型矩阵 [ABBC] 顺序主子式 A、ABBC 均大于 0,即 A>0 并且 AC−B2>0,该二次型正定,从而 f(x0+h,y0+k)−f(x0,y0)>0,P0 是极小值点;
(2) 当二次型矩阵 [ABBC] 顺序主子式 A、ABBC 与 (−1)k 同号,即 A<0 并且 AC−B2>0,该二次型负定,从而 f(x0+h,y0+k)−f(x0,y0)<0,P0 是极大值点;
(3) 当 ABBC<0 ,二次型矩阵 [ABBC] 的特征值 λ1λ2=AC−B2<0。由于实对称矩阵总是可以使用正交矩阵对角化,有 [ABBC]∼T[λ100λ2],从而二次型不定,f(x0+h,y0+k)−f(x0,y0) 的符号与 h,k 的取值有关,P0 不是极值点;
(4) 当 ABBC=0,由于实对称矩阵总是可以使用正交矩阵对角化,有 [ABBC]∼T[tr([ABBC])000],二次型的正定性与二次型矩阵的迹有关,凭此可判断 P0 是极小值点(二次型正定)还是极大值点(二次型负定)。■
Note
这里的矩阵 [ABBC] 的名字叫做 Hessian 矩阵。结论可以推广至有限的 n 维形式。
多元函数的条件最值(拉格朗日乘数法)
当 f 和 G 都有连续偏导数时,求解 f(x,y,z) 在约束条件 G(x,y,z)=0 下的极值点 (x0,y0,z0),可以转化为求解方程组 ⎩⎨⎧fx′+λGx′=0fy′+λGy′=0fz′+λGz′=0G=0 的解。
这个方程组的解是函数 L(x,y,z,λ)=f(x,y,z)+λG(x,y,z) 取得极值的必要条件。这个方法称为拉格朗日乘数法。
证明. 由于 G 具有连续偏导数,因此 G(x,y,z)=0 唯一确定隐函数 z=z(x,y),从而问题转化为求解 u=f(x,y,z(x,y)) 的无条件极值。
u=f(x,y,z(x,y)) 在点 (x0,y0) 处取得极值的必要条件是 ux′(x0,y0)=0,uy′(x0,y0)=0。由链式法则以及隐函数求导法,有
⎩⎨⎧ux′=fx′+fz′zx′=fx′−Gz′Gx′fz′=0uy′=fy′+fz′zy′=fy′−Gz′Gy′fz′=0
从而 ⎩⎨⎧Gx′fx′=Gz′fz′Gy′fy′=Gz′fz′,即 Gx′fx′=Gy′fy′=Gz′fz′=−λ。
这等价于 ⎩⎨⎧fx′+λGx′=0fy′+λGy′=0fz′+λGz′=0。■
Question
Gz′(x0,y0,z0)=0 ?
使用拉格朗日乘数法可以求解在给定约束 G(x,y,z)=0 下的所有可能极值点(由于是必要条件)。因此,只需要比较在这些点上函数 f(x,y,z) 的值,就可以得到函数 f(x,y,z) 在约束 G(x,y,z)=0 下的最值。
偏导数在几何上的应用