叶卢庆的博客

多元函数微分学小结

#多元函数导数的概念以及雅可比矩阵
设$f:\mathbf{R}^n\rightarrow \mathbf{R}^m$是从$n$维线性空间$ \mathbf{R}^n$到$m$维线性空间$\mathbf{R}^m$的映射.如果$f$在$\mathbf{R}^n$中的某点可微,则在那点附近,$f$会被仿射映射很好地逼近.这就是把非线性映射线性化的思想.具体地,$f$在$x_0\in\mathbf{R}^n$处可微,定义为存在线性映射$ T:\mathbf{R}^n\rightarrow\mathbf{R}^m$,使得
\begin{equation}
\label{eq:1}
f(x)=f(x_0)+T(x-x_0)+o||x-x_0||.
\end{equation}其中$||x-x_0||$是$ \mathbf{R}^n$中的点$x$和$x_0$的欧氏距离.$o||x-x_0||$是关于$||x-x_0||$的高阶无穷小量.线性映射$T$称为$f$在$ x_0$处的导数,记为$f’(x_0)$.可见,$f$在$x_0$处可微的意思是,在 $ x_0$附近,$ f(x)$ 可以被仿射映射 $ f(x_0)+T(x-x_0)$ 很好地逼近,它们之间的差距是高阶无穷小量$ o(||x-x_0||)$.

注1: 我们把$T$称为线性映射,也可以把$T(x)$ 称为线性映射.对此不加区分.严格地来说,两者还是有区别的,但是正如我们把映射 $ f$ 称为函数,也常常 把 $ f(x)$ 称为函数一样,映射和映射产生的结果这两者的差异基本可以忽略.基 于同样的理由,我们也把 $ f(x_0)+T(x-x_0)$ 叫做仿射映射.

现在证明导数的唯一性.即证明如下命题:

定理1: 若 $f:\mathbf{R}^n\rightarrow \mathbf{R}^m$ 在 $ x_0\in \mathbf{R}^n$ 处的导数 为 $ T$,则 $ T$ 是唯一的.

证明: 假若存在两个不同的线性映 射 $ T_1:\mathbf{R}^n\rightarrow\mathbf{R}^m$,$ T_2:\mathbf{R}^n\rightarrow\mathbf{R}^m$, 使得
\begin{equation}
\label{eq:2}
f(x)=f(x_0)+T_1(x-x_0)+o_1||x-x_0||.
\end{equation}
\begin{equation}
\label{eq:3}
f(x)=f(x_0)+T_2(x-x_0)+o_2||x-x_{0}||.
\end{equation}
则方程\eqref{eq:2}与方程\eqref{eq:3}作差可得
\begin{equation}
\label{eq:4}
T_1(x-x_0)-T_2(x-x_0)=o_2||x-x_0||-o_1||x-x_{0}||=o_3||x-x_0||.
\end{equation}
也就是说,
\begin{equation}
\label{eq:5}
\lim_{x\rightarrow x_0;x\neq x_0}\frac{T_1(x-x_0)-T_2(x-x_0)}{||x-x_0||}=0.
\end{equation}
根据线性映射的性质,我们知道,
\begin{equation}
\label{eq:6}
\frac{T_1(x-x_0)}{||x-x_0||}=T_1(e),\frac{T_2(x-x_0)}{||x-x_0||}=T_2(e).
\end{equation}
其中 $e=\frac{x-x_0}{||x-x_0||}$ 是单位向量.于是式 5 变 为对于一切单位向量 $ e\in \mathbf{R}^n$,我们有
\begin{equation}
\label{eq:7}
T_1(e)=T_2(e)
\end{equation}
因此 $ T_1=T_2$(为什么?提示:考虑 $ \mathbf{R}^n$ 的标准正交基中的所有单 位向量.),这与 $ T_1\neq T_2$ 矛盾.可见 $ f$ 在 $ x_0$ 处的导数是唯一的. $ \Box$

接下来我们给出几个例子,以此阐述上面的定义.

例1: 当 $ n=m=1$ 时,$ f$ 是从 $ \mathbf{R}$ 到 $ \mathbf{R}$ 的映射.在一元微积 分里我们知道,$ f$ 在点 $ x_0\in \mathbf{R}$ 处可微的定义是,存在一个实 数 $ f’(x_0)$,使得
\begin{equation}
\label{eq:8}
f(x)=f(x_0)+f’(x_0)(x-x_0)+o(|x-x_0|).
\end{equation}
其中 $ o(|x-x_0|)$ 是关于 $ |x-x_0|$ 的高阶无穷小量.在这个例子里,$$ {\displaystyle y=f(x_0)+f’(x_0)(x-x_0) }$$是经过点 $ (x_0,f(x_0))$,斜率为 $ f’(x_0)$ 的直线,根据注1,不妨将其看成一 个仿射映射.

注2在一元微积分里,导数被定义成一个实数.但是在多元微积分里,导数成了一个线性映射.两者的定义是存在矛盾的.但是实数$f’(x_0)$乘以$x$ 与映射$T(x)=f’(x_0)x$的差别基本可以忽略,因此这种定义上的不协调是可以被容忍的.

例2:当 $n=2$,$ m=1$ 时,$ f$ 是从 $ \mathbf{R}^2$ 到 $ \mathbf{R}$ 的映射.与例1类似,这也有着直观的图景.我们可以在空间直角坐标系里 以 $ z=f(x,y)$ 的方式直观地呈现出 $ f$ 的图像.那么现在,$f$ 在某点 $ (x_0,y_0)$ 处可微是什么意思呢? 首先,我们希望 $f$ 在点 $ (x_0,y_0)$ 处分别关于 $ x,y$ 的偏导数要存 在,即 $ \frac{\partial f}{\partial x}(x_0,y_0),\frac{\partial f}{\partial y}(x_0,y_0)$ 要存在.其次,我们希望,$ f$ 在点 $ (x_0,y_0)$处要与一个平面相交,且在 $ (x_0,y_0)$ 附近应当要 与那个平面十分吻合,即 $ f$ 与该平面的差距要以高阶无穷小 量 $ o||(x,y)-(x_0,y_0)||$ 的方式存 在,其中 $ ||(x,y)-(x_0,y_0)||$ 表示 $ \mathbf{R}^2$ 中的 点 $ (x,y)$与 $ (x_0,y_0)$ 的欧氏距离,也 即,$ ||(x,y)-(x_0,y_0)||=\sqrt{(x-x_0)^2+(y-y_0)^2}$.现在,我们设那个平面方程为
\begin{equation}
\label{eq:9}
Ax+By+Cz+D=0.
\end{equation}
自然地,$ C\neq 0$,否则该平面将垂直于 $ xy$ 平面,即映 射 $ f$ 在点$ (x_0,y_0)$ 处的切平面是垂直于 $ xy$ 平面,这并不是我们想要 的情形.因此我们可以把平面方程\eqref{eq:9}化为一个仿射映射$$ {\displaystyle z=-\frac{A}{C}x-\frac{B}{C}y-\frac{D}{C}. }$$

易得 $ \frac{\partial z}{\partial x}=\frac{-A}{C}$,$ \frac{\partial z}{\partial y}=\frac{-B}{C}$.而且由于
\begin{equation}
\label{eq:10}
\frac{\partial z}{\partial x}=\frac{\partial f}{\partial x}(x_0,y_0),\frac{\partial z}{\partial y}=\frac{\partial f}{\partial y}(x_0,y_0)
\end{equation}
因此,平面方程变为$$ {\displaystyle z=\frac{\partial f}{\partial x}(x_0,y_0)x+\frac{\partial f}{\partial y}(x_0,y_0)y-\frac{D}{C}. }$$而且由于平面通过点 $ (x_0,y_0,f(x_0,y_0))$,因此我们有$$ {\displaystyle f(x_0,y_0)=\frac{\partial f}{\partial x}(x_0,y_0)x_{0}+\frac{\partial f}{\partial y}(x_0,y_0)y_{0}-\frac{D}{C}. }$$
因此平面的方程为
\begin{equation}
\label{eq:11}
z=\frac{\partial f}{\partial x}(x_0,y_0)(x-x_0)+\frac{\partial f}{\partial y}(x_0,y_0)(y-y_0)+f(x_0,y_0).
\end{equation}
可见,
\begin{equation}
\label{eq:12}
f(x)=\frac{\partial f}{\partial x}(x_0,y_0)(x-x_0)+\frac{\partial f}{\partial y}(x_0,y_0)(y-y_0)+f(x_0,y_0)+o||(x,y)-(x_0,y_{0})||.
\end{equation}
把\eqref{eq:12}式写成标准的形式,为
\begin{equation}
\label{eq:13}
f(x)=f(x_0,y_0)+\begin{pmatrix} \frac{\partial f}{\partial x}(x_0,y_0)&\frac{\partial f}{\partial y}(x_0,y_0)\end{pmatrix}\left(\begin{pmatrix} x\\ y\\ \end{pmatrix}-\begin{pmatrix} x_0\\ y_0\\ \end{pmatrix}\right)+o||(x,y)-(x_0,y_0)||.
\end{equation}
这样就和\eqref{eq:1}得到了形式上的统一.把矩阵
$$ {\displaystyle \begin{pmatrix} \frac{\partial f}{\partial x}(x_0,y_0)&\frac{\partial f}{\partial y}(x_0,y_0)\end{pmatrix}}$$
代表的从 $ \mathbf{R}^2$ 到 $ \mathbf{R}$的 线性映射叫做 $ f$ 在$ (x_0,y_0)$ 处的导数.

例3: 当 $ n=1$,$ m=2$ 时,$ f$ 是从 $ \mathbf{R}$ 到 $ \mathbf{R}^2$ 的映射.我 们看此时 $ f$ 的导数应当要怎么定义.为此,先看一个物理问题:

(匀速圆周运动)一个质点在单位圆 $ \{(x,y)\in \mathbf{R}^2:x^2+y^2=1\}$ 上做逆时针匀速圆周运动,运动频率为每秒1周.运 动的起始点在$ (0,1)$.我们看看在这种情况下该质点的速度(即位移 $ s$ 相对 于时间 $ t$的导数)意味着什么.在时间 $ t_0$,质点位于 $ (\cos2\pi t_0,\sin2\pi t_0)$.我们认为该运动在 $ t_0$ 时刻的导数,也就是在 $ t_0$时 刻的速度,应当是
\begin{equation}
\label{eq:14}
\lim_{\Delta t\rightarrow 0;\Delta t\neq 0}\frac{\begin{pmatrix} \cos2\pi(t_0+\Delta t)\\ \sin2\pi (t_0+\Delta t) \end{pmatrix}-\begin{pmatrix} \cos2\pi t_0\\ \sin2\pi t_0 \end{pmatrix}}{\Delta t}=\begin{pmatrix} \frac{\partial f_1}{\partial t}(t_0)\\ \frac{\partial f_2}{\partial t}(t_0)\\ \end{pmatrix}=\begin{pmatrix} -2\pi\sin2\pi t_0\\ 2\pi\cos2\pi t_0 \end{pmatrix}.
\end{equation}
可见,此时的导数可以被看做一个从 $ \mathbf{R}$ 到 $ \mathbf{R}^2$ 的线性 映射.

对于一般情形来说,当 $ f:\mathbf{R}\rightarrow \mathbf{R}^m$ ,且 $ f$ 在点$ x_0\in \mathbf{R}$ 处可微时,容易验证 $ f$ 在 $ x_0$ 处的导 数是$$ {\displaystyle \begin{pmatrix} \frac{\partial f_1}{\partial x}(x_0)\\ \vdots\\ \frac{\partial f_m}{\partial x}(x_0)\\ \end{pmatrix}. }$$这是一个从 $ \mathbf{R}$ 到 $ \mathbf{R}^m$ 的线性映射.

既然 $ f:\mathbf{R}^n\rightarrow \mathbf{R}^n$ 在 $ x_0\in \mathbf{R}^n$ 处的导数 是一个从 $ \mathbf{R}^n\rightarrow \mathbf{R}^m$ 的线性映射,那么我们尝试推导导数对应的矩阵,这个矩阵叫雅可比矩阵(Jacobian matrix).

定理2 (雅可比矩阵的推导) 根据导数的定义,
\begin{equation}
\label{eq:15}
f(x)=f(x_0)+T(x-x_0)+o||x-x_0||.
\end{equation}
于是
\begin{equation}
\label{eq:16}
\frac{f(x)-f(x_0)}{||x-x_0||}=T(e)+\frac{o||x-x_0||}{||x-x_0||}.
\end{equation}
其中 $ e=\frac{x-x_0}{||x-x_0||}$ 是 $ \mathbf{R}^n$ 中的单位向量.不妨 令$ {\displaystyle e=e_i=\begin{pmatrix} 0\\ \vdots\\ 1\\ \vdots\\ 0\\ \end{pmatrix}\mbox{1位于第}i\mbox{行.}(1\leq i\leq n) }$,也就是说,我们让 $ x$ 沿着 $ \mathbf{R}^n$ 的一组标准正交基中的第 $ i$ 个坐 标 $ e_i$ 趋于 $ x_0$,那么此时,\eqref{eq:16}将会变成
\begin{equation}
\label{eq:17}
\frac{\partial f}{\partial e_i }(x_0)=T(e_i).
\end{equation}
因此,导数$T$对应的雅可比矩阵为
$$ {\displaystyle \begin{pmatrix} \frac{\partial f}{\partial e_1}(x_0)&\frac{\partial f}{\partial e_2}(x_0)&\cdots&\frac{\partial f}{\partial e_n}(x_0) \end{pmatrix}.}$$且由例3可得,对于任意一个 $ 1\leq j\leq n$ 来说,$$ {\displaystyle \frac{\partial f}{\partial e_j}(x_0)=\begin{pmatrix} \frac{\partial f_1}{\partial e_j}(x_0)\\ \vdots\\ \frac{\partial f_m}{\partial e_j}(x_0)\\ \end{pmatrix}. }$$于是,导数$T$对应的雅可比矩阵最终可以写为$${\displaystyle \begin{pmatrix} \frac{\partial f_1}{\partial e_1}(x_0) & \cdots & \frac{\partial f_1}{\partial e_n}(x_0) \\ \vdots & \ddots & \vdots \\ \frac{\partial f_m}{\partial e_1}(x_0) & \cdots & \frac{\partial f_m}{\partial e_n}(x_0) \end{pmatrix}.}$$

#复合函数求导的链法则
定理3(复合函数求导的链法则) 设 $ f:\mathbf{R}^n\rightarrow \mathbf{R}^m$,且 $ g:\mathbf{R}^m\rightarrow \mathbf{R}^k$.$ f$ 在点 $ x_0\in \mathbf{R}^n$ 处可 微,$ g$ 在点$ f(x_0)\in \mathbf{R}^m$ 处可微,则复合函数 $ g\circ f$ 在点$ x_0\in\mathbf{R}^n$ 处可微.且$$ {\displaystyle (g\circ f)’(x_0)=g’(f(x_0))f’(x_0). }$$

复合函数求导的链法则的本质,是线性映射的复合,翻译成矩阵的语言,也就是矩 阵的乘法.下面来详细阐述这一点.由于 $ f$ 在点 $ x_0\in \mathbf{R}^n$ 处可微,因此根据可微的定 义,$ f$ 在$ x_0$ 附近可以近似地看成一个仿射映射,也即,
\begin{equation}
\label{eq:18}
f(x)\approx f(x_0)+f’(x_0)(x-x_0).
\end{equation}
由于 $ g$ 在点 $ f(x_0)$ 处可微,因此 $ g$ 在 $ f(x_0)$ 附近也可以近似地看成 一个仿射映射,也即,
\begin{equation}
\label{eq:19}
g(f(x))\approx g(f(x_0))+g’(f(x_0))(f(x)-f(x_0)).
\end{equation}
将式\eqref{eq:18}带入式\eqref{eq:19},可得
\begin{equation}
\label{eq:20}
g(f(x))\approx g(f(x_0))+g’(f(x_0))f’(x_0)(x-x_0).
\end{equation}
可见,对于复合函数 $ g(f(x))$ 来说,$ g’(f(x_0))f’(x_0)$ 的确就是其在 $ x_0$ 处的导数.

当然,上面的叙述还是不太严格的,严格的证明如下.

证明:: $ f(x)$ 在 $ x_0$ 处可微,表明
\begin{equation}
\label{eq:21}
f(x)=f(x_0)+f’(x_0)(x-x_0)+o_1||x-x_0||.
\end{equation}
$ g(x)$ 在 $ f(x_0)$ 处可微,表明
\begin{equation}
\label{eq:22}
g(f(x))=g(f(x_0))+g’(f(x_0))(f(x)-f(x_0))+o_2||f(x)-f(x_0)||.
\end{equation}
将式\eqref{eq:21}代入式\eqref{eq:22},可得
\begin{equation}
\label{eq:23}
g(f(x))=g(f(x_0))+g’(f(x_0))f’(x_0)(x-x_0)+g’(f(x_0))o_1||x-x_0||+o_2||f(x)-f(x_0)||.
\end{equation}
下面证明 $ g’(f(x_0))o_1||x-x_0||+o_2||f(x)-f(x_0)||$ 是关 于 $ ||x-x_0||$ 的高阶无穷小量.首先$g’(f(x_0))o_1||x-x_0||$ 肯定是关 于 $ ||x-x_0||$ 的高阶无穷小量,因此我们只用证明 $ o_2||f(x)-f(x_0)||$ 是关 于 $ ||x-x_0||$ 的高阶无穷小量.我们知道,$${\displaystyle \lim_{f(x)\rightarrow f(x_0);f(x)\neq f(x_0)}\frac{o_2||f(x)-f(x_0)||}{||f(x)-f(x_0)||}=0,}$$因此$${\displaystyle \lim_{x\rightarrow x_0;x\neq x_0} \frac{o_2||f(x)-f(x_0)||}{||f’(x_0)(x-x_0)+o_1||x-x_0||||}=0.}$$分子分母同除以 $||x-x_0||$,得到
\begin{equation}
\label{eq:24}
\lim_{x\rightarrow x_0;x\neq x_0}\frac{\frac{o_2||f(x)-f(x_0)||}{||x-x_0||}}{\frac{||f’(x_0)(x-x_0)+o_1||x-x_0||}{||x-x_0||}}=0.
\end{equation}
易得$$ {\displaystyle \lim_{x\rightarrow x_0;x\neq x_0} \frac{||f’(x_0)(x-x_0)+o_1||x-x_0||}{||x-x_0||}=\lim_{x\rightarrow x_0;x\neq x_0}||f’(x_0)e||. }$$其中 $ e$ 是单位向量 $ \frac{x-x_0}{||x-x_0||}$.必定存在恒定的 $ e\in \mathbf{R}^n$,使得 $ ||f’(x_0)e||$ 为一个固定的正数 $ C$,且与此同时 有$ x\rightarrow x_0$.因此\eqref{eq:24}化为$$ {\displaystyle \lim_{x\rightarrow x_0;x\neq x_0}\frac{o_2||f(x)-f(x_0)||}{C||x-x_0||}=0, }$$因此 $ o_2||f(x)-f(x_0)||$ 是关于 $ ||x-x_0||$ 的高阶无穷小量.综上,命题得证. $ \Box$

我们知道,$ f’(x_0)$ 是从 $ \mathbf{R}^n$ 到 $ \mathbf{R}^m$ 的线性映 射,$ g’(f(x_0))$ 是从 $ \mathbf{R}^m$ 到 $ \mathbf{R}^k$ 的线性映 射.因此$ g’(f(x_0))f’(x_0)$ 是线性映射 $ f’(x_0)$ 和 线性映 射 $ g’(f(x_0))$ 的复合,是一个从 $ \mathbf{R}^n$ 到 $ \mathbf{R}^k$ 的线性 映射,也是 $ g\circ f$ 在点 $ x_0$ 处的导数.$ f’(x_0)$ 对应的雅可比矩阵为
$$ {\displaystyle \begin{pmatrix} \frac{\partial f_1}{\partial e_1}(x_0) & \cdots & \frac{\partial f_1}{\partial e_n}(x_0) \\ \vdots & \ddots & \vdots \\ \frac{\partial f_m}{\partial e_1}(x_0) & \cdots & \frac{\partial f_m}{\partial e_n}(x_0) \end{pmatrix} }$$
其中 $ {e_1,\cdots,e_n}$ 是 $ \mathbf{R}^n$ 中的一组标准正交基,
\begin{equation}
\label{eq:25}
e_i=\begin{pmatrix} 0\\ \vdots\\ 1\\ \vdots\\ 0\\ \end{pmatrix}\mbox{1位于第i行.}(1\leq i\leq n)
\end{equation}
$ g’(f(x_0))$ 对应的雅可比矩阵为
$$ {\displaystyle \begin{pmatrix} \frac{\partial g_1}{\partial \mu_1}(g(x_0)) & \cdots & \frac{\partial g_1}{\partial \mu_m}(f(x_0)) \\ \vdots & \ddots & \vdots \\ \frac{\partial g_k}{\partial \mu_1}(f(x_0)) & \cdots & \frac{\partial g_k}{\partial \mu_m}(f(x_0)) \end{pmatrix}, }$$
其中 $ {\mu_1,\cdots,\mu_m}$ 是 $ \mathbf{R}^m$ 中的一组标准正交基,
$$ {\displaystyle \mu_j=\begin{pmatrix} 0\\ \vdots\\ 1\\ \vdots\\ 0 \end{pmatrix}\mbox{(1位于第j行)}(1\leq k\leq m) }$$
那么线性映射 $ (g\circ f)’(x_0)$ 对应的矩阵应该为
$$ {\displaystyle \begin{pmatrix} \frac{\partial g_1}{\partial \mu_1}(g(x_0)) & \cdots & \frac{\partial g_1}{\partial \mu_m}(f(x_0)) \\ \vdots & \ddots & \vdots \\ \frac{\partial g_k}{\partial \mu_1}(f(x_0)) & \cdots & \frac{\partial g_k}{\partial \mu_m}(f(x_0)) \end{pmatrix}\begin{pmatrix} \frac{\partial f_1}{\partial e_1}(x_0) & \cdots & \frac{\partial f_1}{\partial e_n}(x_0) \\ \vdots & \ddots & \vdots \\ \frac{\partial f_m}{\partial e_1}(x_0) & \cdots & \frac{\partial f_m}{\partial e_n}(x_0) \end{pmatrix}.(为什么?提示:线性映射的复合和矩阵的乘法是一回事.) }$$

#可微的充分条件
设函数 $ f:\mathbf{R}^n\rightarrow \mathbf{R}^m$ 在点 $ x_0\in\mathbf{R}^n$ 处可 微,通过在该点导数的雅可比矩阵知道,$ f$ 在该点的导数是被 $ f$ 在该点的各个 偏导数确定的.也就是说,如果 $ f$ 在点 $ x_0$ 处可微,且 $ f$ 在点 $ x_0$ 处的 各个一阶偏导数已知,那么 $ f$ 在该点处的导数也已知.但是这里还有一个问 题,怎么判断 $ f$ 在 $ x_0$ 处可微?我们知道,通过可微的定义来判断导数是否存 在是不太现实的,幸亏的是,我们能通过偏导数在点 $ x_0$ 处的连续性来判 断 $ f$ 在 $ x_0$点的可微性.这就是下面的定理:

定理4 若 $ f:\mathbf{R}^n\rightarrow \mathbf{R}^m$ 在 $ \mathbf{R}^n$ 上的一切偏导数 都存在并且偏导数在 $ x_0$ 处连续,那么$ f$在$ x_0$处可微(事实上不仅可微,更是连续可微.).

注3:值得注意的是,对于 $ n=1$ 的特殊情形,不必要求“偏导数在 $ x_0$ 处连续”这 个条件.这一点根据导数以及偏导数的定义很容易验证.实际上,在这种情形,偏 导数就是导数.

注4: $ f$ 在 $ x_0$ 处偏导数连续只是 $ f$ 在 $ x_0$ 处可微的充分条件,也就是 说,$ f$ 在 $ x_0$ 处可微未必能推出 $ f$ 在 $ x_0$ 处的偏导数连续.一个简 单的例子就是,当 $ f:\mathbf{R}\rightarrow \mathbf{R}$ 在点 $ x_0\in\mathbf{R}$ 可微的时候,$ f$ 在 $ x_0$ 处的导数未必连续,由于此时 $ f$ 的偏导数和导数 是重合的概念,因此 $ f$ 在 $ x_0$ 处的偏导数未必连续.虽说不是充要条件, 但是这个定理还是很有价值的,因为它提供了判别一类函数在某点是否可微的 方法.

为了证明该定理,我们的一贯策略是先考虑简单情形:

简单情形:设$E$是$\mathbf{R}^2$的开子集,$f:E\to \mathbf{R}$是函数,$(x_1’,x_2’)$是$E$的内点.如果在$E$上一切偏导数$\frac{\partial f}{\partial x_j}$存在,且在$(x_1’,x_2’)$处连续,则$f$在$(x_1’,x_2’)$处可微.

证明:存在$\xi_1\in (x_1,x_1’),\xi_2\in (x_2,x_2’)$,使得
\begin{align*}
f(x_1,x_2)-f(x_1’,x_2’)&=f(x_1,x_2)-f(x_1’,x_2)+f(x_1’,x_2)-f(x_1’,x_2’)
\\&=\left(\frac{\partial f}{\partial
x_1}(x_1’,x_2)(x_1-x_1’)+o_1(x_1-x_1’)\right)+\left(\frac{\partial
f}{\partial x_2}(x_1’,x_{2}’)(x_2-x_{2}’)+o_{2}(x_{2}-x_{2}’)\right)
\end{align*}
其中,
$$
\lim_{x_1\to x_1’}\frac{o_1(x_1-x_1’)}{x_1-x_1’}=0,\lim_{x_2\to x_2’}\frac{o_2(x_2-x_2’)}{x_2-x_2’}=0.
$$
也即,
\begin{equation}
\label{eq:1.1}
f(x_1,x_2)-f(x_1’,x_2’)=
\begin{pmatrix}
\frac{\partial f}{\partial x_1}(x_1’,x_2)&\frac{\partial
f}{\partial x_2}(x_1’,x_2’)
\end{pmatrix}
\begin{pmatrix}
x_1-x_1’\\
x_2-x_2’
\end{pmatrix}+
\begin{pmatrix}
o_1(x_1-x_1’)\\
o_2(x_2-x_2’)
\end{pmatrix}.
\end{equation}
设$\frac{\partial f}{\partial x_1}(x_1’,x_2)=\frac{\partial f}{\partial x_1}(x_1’,x_2’)+\delta$.由偏导数的连续性,当$(x_1,x_2)\to (x_1’,x_2’)$时,$\delta\to 0$.因此式\eqref{eq:1.1}实际上可以改写成
\begin{equation}
\label{eq:2.1}
f(x_1,x_2)-f(x_1’,x_2’)=
\begin{pmatrix}
\frac{\partial f}{\partial x_1}(x_1’,x_2’)&\frac{\partial
f}{\partial x_2}(x_1’,x_2’)
\end{pmatrix}
\begin{pmatrix}
x_1-x_1’\\
x_2-x_2’
\end{pmatrix}+
\begin{pmatrix}
o_1’(x_1-x_1’)\\
o_2’(x_2-x_2’)
\end{pmatrix},
\end{equation}
其中$$\lim_{x_1\to x_1’}\frac{o_1’(x_1-x_1’)}{x_1-x_1’}=0,\lim_{x_2\to x_2’}\frac{o_2’(x_2-x_2’)}{x_2-x_2’}=0.$$
这样就说明了$f$在$(x_1’,x_2’)$处的可微性.

下面再证明一般情形:

证明:: 为了证明 $ f$ 在 $ x_0$ 处可微,我们只用证明,存在线性映射 $ T$,
使得
\begin{equation}
\label{eq:26}
f(x)-f(x_0)=T(x-x_0)+o||x-x_0||
\end{equation}

\begin{equation}
\label{eq:27}
x-x_0=v_1e_1+v_2e_2+\cdots+v_ne_n.
\end{equation}
其中 $ e_i$ 按式 25 来定义,$ \forall 1\leq i\leq n$,$ v_i\in\mathbf{R}$.则根据线性映射的性质,式26变为
\begin{equation}
\label{eq:28}
f(x)-f(x_0)=v_1T(e_1)+v_2T(e_2)+\cdots+v_nT(e_n)+o||x-x_0||.
\end{equation}
\eqref{eq:28}可以化为
\begin{equation}
\label{eq:29}
f(v_1e_1+v_2e_2+\cdots+v_ne_n+x_0)-f(x_0)=v_1T(e_1)+v_2T(e_2)+\cdots+v_nT(e_n)+o||x-x_0||.
\end{equation}
下面我们来看 $ f(v_1e_1+v_2e_2+\cdots+v_ne_n+x_0)-f(x_0)$.将其变形,可得
\begin{equation}
\label{eq:30}
\begin{split} &f(v_1e_1+v_2e_2+\cdots+v_ne_n+x_0)-f(x_0)\\&=f(v_1e_1+x_0)-f(x_0)\\&+f(v_1e_1+v_2e_2+x_0)-f(v_1e_1+x_0)\\&+f(v_1e_1+v_2e_2+v_3e_3+x_0)-f(v_1e_1+v_2e_2+x_0)\\&+\cdots\\&+f(v_1e_1+v_2e_2+\cdots+v_ne_n+x_0)-f(v_1e_1+v_2e_2+\cdots+v_{n-1}e_{n-1}+x_0). \end{split}
\end{equation}
由于 $ f$ 在 $ \mathbf{R}^n$ 上的所有点的偏导数存在,因此式 30可以化为
\begin{equation}
\label{eq:31}
\begin{split} &f(v_1e_1+v_2e_2+\cdots+v_ne_n+x_0)-f(x_0)\\&=\frac{\partial f}{\partial e_1}(x_{0})(v_1e_{1})+o_{1}||v_{1}e_{1}||\\&+\frac{\partial f}{\partial e_{2}}(v_{1}e_{1}+x_{0})(v_{2}e_{2})+o_{2}||v_{2}e_{2}||\\&+\frac{\partial f}{\partial e_{3}}(v_{1}e_{1}+v_{2}e_{2}+x_{0})(v_{3}e_{3})+o_{3}||v_{3}e_{3}||\\&+\cdots\\&+\frac{\partial f}{\partial e_n}(v_1e_1+v_2e_2+\cdots+v_{n-1}e_{n-1}+x_0)(v_ne_n)+o||v_ne_n||. \end{split}
\end{equation}
根据式\eqref{eq:27},在 $ x\rightarrow x_0$ 时,必定有 $ v_1e_1,v_2e_2,\cdots,v_ne_n\rightarrow 0$.结合 $ f$ 在 $ x_0$ 处偏导数的连续性,可得对于任意给定的正实数 $ \varepsilon$,都存在相应的正实数 $ \delta$,使得当 $ |x-x_0|<\delta$ 时,我们有
\begin{equation}\label{eq:32}
\begin{cases} |\frac{\partial f}{\partial e_1}(x_0)-\frac{\partial f}{\partial e_1}(x_0)|<\varepsilon.\\ |\frac{\partial f}{\partial e_2}(v_1e_1+x_0)-\frac{\partial f}{\partial e_2}(x_0)|<\varepsilon.\\ |\frac{\partial f}{\partial e_3}(v_1e_1+v_2e_2+x_0)-\frac{\partial f}{\partial e_3}(x_0)|<\varepsilon.\\ \vdots\\ |\frac{\partial f}{\partial e_n}(v_1e_1+v_2e_2+\cdots+v_{n-1}e_{n-1}+x_0)-\frac{\partial f}{\partial e_n}(x_0)|<\varepsilon. \end{cases}
\end{equation}
将\eqref{eq:32}代入\eqref{eq:31},可得
\begin{equation}
\label{eq:33}
\begin{split} &f(v_1e_1+v_2e_2+\cdots+v_ne_n+x_0)-f(x_0)\\&=\frac{\partial f}{\partial e_1}(x_{0})(v_1e_{1})+p_1\varepsilon+o_{1}||v_{1}e_{1}||\\&+\frac{\partial f}{\partial e_{2}}(x_{0})(v_{2}e_{2})+p_{2}\varepsilon+o_{2}||v_{2}e_{2}||\\&+\frac{\partial f}{\partial e_{3}}(x_{0})(v_{3}e_{3})+p_{3}\varepsilon+o_{3}||v_{3}e_{3}||\\&+\cdots\\&+\frac{\partial f}{\partial e_n}(x_0)(v_ne_n)+p_{n}\varepsilon+o||v_ne_n||. \end{split}
\end{equation}
其中 $ p_1,p_2,\cdots,p_n\in (0,1)$.将式33代回\eqref{eq:29},得到
\begin{equation}
\label{eq:34}
\begin{split} &\frac{\partial f}{\partial e_1}(x_{0})(v_1e_{1})+p_1\varepsilon+o_{1}||v_{1}e_{1}||\\&+\frac{\partial f}{\partial e_{2}}(x_{0})(v_{2}e_{2})+p_{2}\varepsilon+o_{2}||v_{2}e_{2}||\\&+\frac{\partial f}{\partial e_{3}}(x_{0})(v_{3}e_{3})+p_{3}\varepsilon+o_{3}||v_{3}e_{3}||\\&+\cdots\\&+\frac{\partial f}{\partial e_n}(x_0)(v_ne_n)+p_{n}\varepsilon+o||v_ne_n||\\&=v_1T(e_1)+v_2T(e_2)+\cdots+v_nT(e_n)+o||x-x_0||. \end{split}
\end{equation}
由式34可得
\begin{equation}
\label{eq:35}
v_{1}\frac{\partial f}{\partial e_1}e_{1}+v_{2}\frac{\partial f}{\partial e_2}(x_0)e_2+\cdots+v_n\frac{\partial f}{\partial e_n}(x_0)e_n=v_1T(e_1)+v_2T(e_2)+\cdots+v_nT(e_n).
\end{equation}
于是可得 $T$ 是存在的,而且式\eqref{eq:35}还给出了其确切的表达式,也就 是说,$T$ 不但存在,而且其对应的矩阵是雅可比矩阵.