变分法基础(三)

前两节我们介绍了泛函和一些积分的引理。到了这一节,我们终于正式谈一谈变分了。读者们可以通过联想我们的微分定义来看一节。

令$J[y]$是赋范线性空间上的一个泛函,定义$\Delta J[h] = J[y + h] - J[y]$。注意上式和y,h都有关系,因此是双变量泛函。当$y$是固定的时候,$\Delta J[h]$就是$h$的泛函。假设$$\Delta J[h] = \phi[h] + \epsilon\|h\|$$,其中$\phi[h]$是一个线性泛函,而当$\|h\|\rightarrow 0\|$时$\epsilon \rightarrow 0$。这个时候我们称$J[y]$是可微的。增量$\Delta J[h]$的主要线性部分就是$\phi[h]$,也被称为$J[y]$的变分,记作$\delta J[y]$。首先我们要证明符号$\delta J[y]$唯一性($\phi$唯一),和泛函意义上的极值定理(泛函取极值的必要条件)。

定理1:可微泛函的变分是惟一的。
该定理可以通过假设有两个不同的变分,然后证明他们的差是低于一阶的无穷小量,进而矛盾。

定理2:若可微函数$J[y]$在$y=\hat{y}$处取极值,那么其变分在$y=\hat{y}$处发散:
$$\delta J[h]=0$$对于所有可取的$h$成立。
该定理可以通过假设有一个$h$满足$\delta J[h]\not=0$,那么对于$-h$来说$\delta J[-h]$的符号相反,这说明在$y=\hat{y}$附近有比$J[y]$大的值,也有比$J[y]$小的值。总而言之,$J[y]$不是极值点,矛盾。

我们来看看变分法最基础也是最重要的定理:欧拉方程。

令$y(x)$是$[a, b]$上的连续可微泛函,满足$y(a)=A, y(b)=B$。函数$F(x,y,y')$是二阶可导的函数,我们希望找到函数
$$J[y] = \int_{a}^{b} F(x, y, y') \mathrm{d} x$$
关于$y$的极值点。

请注意,这里我们说的极值点对应的搜索空间是$y \in \mathcal{C}^1(a, b)$,而不是一般的$\mathcal{C} (a, b)$。此时,该极值点也被称为弱极值点。

\begin{align}
\Delta J &= J[y + h] - J[y] = \int_{a}^{b} F(x, y + h, y' + h') - F(x, y, y') \mathrm{d} x \\
             &= \int_{a}^{b} [\frac{\partial F}{\partial y}(x, y, y')h + \frac{\partial F}{\partial y'}(x, y, y')h'] + \ldots \mathrm{d} x
\end{align}

其中方括号$[\ldots]$中的部分就是一阶项,那么我们有
$$
\delta J = \int_{a}^{b} [\frac{\partial F}{\partial y}(x, y, y')h + \frac{\partial F}{\partial y'}(x, y, y')h'] \mathrm{d} x
$$

由定理2可知,
$$\delta J =  \int_{a}^{b} [\frac{\partial F}{\partial y}h + \frac{\partial F}{\partial y'}h'] \mathrm{d} x = 0$$

由上一节的Lemma 4可知,
$$\frac{\partial F}{\partial y}-\frac{\mathrm{d}}{\mathrm{d} x}\frac{\partial F}{\partial y'} = 0$$
这就是欧拉方程,下面我们整理下。

定理3:令$J[y]$是下列形式的泛函:
$$J[y] = \int_{a}^{b} F(x, y, y') \mathrm{d} x$$
其中$y(x)$是$[a, b]$上的连续可微泛函,满足$y(a)=A, y(b)=B$,函数$F(x,y,y')$是二阶可导的函数。在$y$处$J[y]$取到极值的必要条件其满足欧拉方程:
$$\frac{\partial F}{\partial y}-\frac{\mathrm{d}}{\mathrm{d} x}\frac{\partial F}{\partial y'} = 0$$

应用:两点之间直线最短。
这个是小学数学学得的知识,我们现在来形式化地证明一下。令$a = 0, b = 1$,
$$F(x, y, y') = \sqrt{\sum_{i} (y'_i(x))^2}$$
那么$J[y] = \int_{a}^{b} F(x, y, y') \mathrm{d} x$就是连接两点A, B之间的曲线的长度,当$J[y]$取到最小值时,其也取到了极小值,由定理3,必满足欧拉方程:
$$\frac{\partial F}{\partial y}-\frac{\mathrm{d}}{\mathrm{d} x}\frac{\partial F}{\partial y'} = 0$$
那么我们有
$$\frac{\partial F}{\partial y}=0, \frac{\partial F}{\partial y'}=\frac{y'}{||y'||_{2}}$$
则$\frac{\mathrm{d}}{\mathrm{d} x}\frac{\partial F}{\partial y'}=0$,则$\frac{y'}{||y'||_{2}}=C$,其中$C是常值向量$。可解得$y'$为常数,这是说$y'$与$x$无关,则$y'$为常数,$y$为线性函数,即连接两点的直线。

实际上,该定理可以推广到黎曼流形上,得到连接两点的曲线满足的方程,我们称为测地线方程;从连接两点的最短曲线必为测地线的这个角度,测地线可以看做直线的推广(因为在欧式空间中,连接两点的最短曲线必为直线)。读者需要注意,反过来是不对的,在黎曼流形上,连接两点的最短曲线必为测地线,但任取一条测地线不一定最短(比如地球上沿东和沿西都可以从中国到美国,这两条都是测地线,但是只有一条最短)。这也是欧拉方程为必要不充分条件的一个直观表示。

评论

此博客中的热门博文

变分法基础(一)

变分法基础(二)