变分法基础（三）

- 三月 06, 2019

前两节我们介绍了泛函和一些积分的引理。到了这一节，我们终于正式谈一谈变分了。读者们可以通过联想我们的微分定义来看一节。

令$J[y]$是赋范线性空间上的一个泛函，定义$\Delta J[h] = J[y + h] - J[y]$。注意上式和y,h都有关系，因此是双变量泛函。当$y$是固定的时候，$\Delta J[h]$就是$h$的泛函。假设$$\Delta J[h] = \phi[h] + \epsilon\|h\|$$，其中$\phi[h]$是一个线性泛函，而当$\|h\|\rightarrow 0\|$时$\epsilon \rightarrow 0$。这个时候我们称$J[y]$是可微的。增量$\Delta J[h]$的主要线性部分就是$\phi[h]$，也被称为$J[y]$的变分，记作$\delta J[y]$。首先我们要证明符号$\delta J[y]$唯一性（$\phi$唯一），和泛函意义上的极值定理（泛函取极值的必要条件）。

定理1：可微泛函的变分是惟一的。
该定理可以通过假设有两个不同的变分，然后证明他们的差是低于一阶的无穷小量，进而矛盾。

定理2：若可微函数$J[y]$在$y=\hat{y}$处取极值，那么其变分在$y=\hat{y}$处发散：
$$\delta J[h]=0$$对于所有可取的$h$成立。
该定理可以通过假设有一个$h$满足$\delta J[h]\not=0$，那么对于$-h$来说$\delta J[-h]$的符号相反，这说明在$y=\hat{y}$附近有比$J[y]$大的值，也有比$J[y]$小的值。总而言之，$J[y]$不是极值点，矛盾。

我们来看看变分法最基础也是最重要的定理：欧拉方程。

令$y(x)$是$[a, b]$上的连续可微泛函，满足$y(a)=A, y(b)=B$。函数$F(x,y,y')$是二阶可导的函数，我们希望找到函数
$$J[y] = \int_{a}^{b} F(x, y, y') \mathrm{d} x$$
关于$y$的极值点。

请注意，这里我们说的极值点对应的搜索空间是$y \in \mathcal{C}^1(a, b)$，而不是一般的$\mathcal{C} (a, b)$。此时，该极值点也被称为弱极值点。

\begin{align}
\Delta J &= J[y + h] - J[y] = \int_{a}^{b} F(x, y + h, y' + h') - F(x, y, y') \mathrm{d} x \\
&= \int_{a}^{b} [\frac{\partial F}{\partial y}(x, y, y')h + \frac{\partial F}{\partial y'}(x, y, y')h'] + \ldots \mathrm{d} x
\end{align}

其中方括号$[\ldots]$中的部分就是一阶项，那么我们有
$$
\delta J = \int_{a}^{b} [\frac{\partial F}{\partial y}(x, y, y')h + \frac{\partial F}{\partial y'}(x, y, y')h'] \mathrm{d} x
$$

由定理2可知，
$$\delta J = \int_{a}^{b} [\frac{\partial F}{\partial y}h + \frac{\partial F}{\partial y'}h'] \mathrm{d} x = 0$$

由上一节的Lemma 4可知，
$$\frac{\partial F}{\partial y}-\frac{\mathrm{d}}{\mathrm{d} x}\frac{\partial F}{\partial y'} = 0$$
这就是欧拉方程，下面我们整理下。

定理3：令$J[y]$是下列形式的泛函：
$$J[y] = \int_{a}^{b} F(x, y, y') \mathrm{d} x$$
其中$y(x)$是$[a, b]$上的连续可微泛函，满足$y(a)=A, y(b)=B$，函数$F(x,y,y')$是二阶可导的函数。在$y$处$J[y]$取到极值的必要条件其满足欧拉方程：
$$\frac{\partial F}{\partial y}-\frac{\mathrm{d}}{\mathrm{d} x}\frac{\partial F}{\partial y'} = 0$$

应用：两点之间直线最短。
这个是小学数学学得的知识，我们现在来形式化地证明一下。令$a = 0, b = 1$，
$$F(x, y, y') = \sqrt{\sum_{i} (y'_i(x))^2}$$
那么$J[y] = \int_{a}^{b} F(x, y, y') \mathrm{d} x$就是连接两点A, B之间的曲线的长度，当$J[y]$取到最小值时，其也取到了极小值，由定理3，必满足欧拉方程：
$$\frac{\partial F}{\partial y}-\frac{\mathrm{d}}{\mathrm{d} x}\frac{\partial F}{\partial y'} = 0$$
那么我们有

$$\frac{\partial F}{\partial y}=0, \frac{\partial F}{\partial y'}=\frac{y'}{||y'||_{2}}$$

则$\frac{\mathrm{d}}{\mathrm{d} x}\frac{\partial F}{\partial y'}=0$，则$\frac{y'}{||y'||_{2}}=C$，其中$C是常值向量$。可解得$y'$为常数，这是说$y'$与$x$无关，则$y'$为常数，$y$为线性函数，即连接两点的直线。

实际上，该定理可以推广到黎曼流形上，得到连接两点的曲线满足的方程，我们称为测地线方程；从连接两点的最短曲线必为测地线的这个角度，测地线可以看做直线的推广（因为在欧式空间中，连接两点的最短曲线必为直线）。读者需要注意，反过来是不对的，在黎曼流形上，连接两点的最短曲线必为测地线，但任取一条测地线不一定最短（比如地球上沿东和沿西都可以从中国到美国，这两条都是测地线，但是只有一条最短）。这也是欧拉方程为必要不充分条件的一个直观表示。

搜索此博客

经典噌噌

变分法基础（三）

评论

发表评论

此博客中的热门博文

变分法基础（一）

变分法基础（二）