变分法基础(三)

前两节我们介绍了泛函和一些积分的引理。到了这一节,我们终于正式谈一谈变分了。读者们可以通过联想我们的微分定义来看一节。

J[y]是赋范线性空间上的一个泛函,定义\Delta J[h] = J[y + h] - J[y]。注意上式和y,h都有关系,因此是双变量泛函。当y是固定的时候,\Delta J[h]就是h的泛函。假设\Delta J[h] = \phi[h] + \epsilon\|h\|,其中\phi[h]是一个线性泛函,而当\|h\|\rightarrow 0\|\epsilon \rightarrow 0。这个时候我们称J[y]是可微的。增量\Delta J[h]的主要线性部分就是\phi[h],也被称为J[y]的变分,记作\delta J[y]。首先我们要证明符号\delta J[y]唯一性(\phi唯一),和泛函意义上的极值定理(泛函取极值的必要条件)。

定理1:可微泛函的变分是惟一的。
该定理可以通过假设有两个不同的变分,然后证明他们的差是低于一阶的无穷小量,进而矛盾。

定理2:若可微函数J[y]y=\hat{y}处取极值,那么其变分在y=\hat{y}处发散:
\delta J[h]=0对于所有可取的h成立。
该定理可以通过假设有一个h满足\delta J[h]\not=0,那么对于-h来说\delta J[-h]的符号相反,这说明在y=\hat{y}附近有比J[y]大的值,也有比J[y]小的值。总而言之,J[y]不是极值点,矛盾。

我们来看看变分法最基础也是最重要的定理:欧拉方程。

y(x)[a, b]上的连续可微泛函,满足y(a)=A, y(b)=B。函数F(x,y,y')是二阶可导的函数,我们希望找到函数
J[y] = \int_{a}^{b} F(x, y, y') \mathrm{d} x
关于y的极值点。

请注意,这里我们说的极值点对应的搜索空间是y \in \mathcal{C}^1(a, b),而不是一般的\mathcal{C} (a, b)。此时,该极值点也被称为弱极值点。

\begin{align} \Delta J &= J[y + h] - J[y] = \int_{a}^{b} F(x, y + h, y' + h') - F(x, y, y') \mathrm{d} x \\              &= \int_{a}^{b} [\frac{\partial F}{\partial y}(x, y, y')h + \frac{\partial F}{\partial y'}(x, y, y')h'] + \ldots \mathrm{d} x \end{align}

其中方括号[\ldots]中的部分就是一阶项,那么我们有
\delta J = \int_{a}^{b} [\frac{\partial F}{\partial y}(x, y, y')h + \frac{\partial F}{\partial y'}(x, y, y')h'] \mathrm{d} x

由定理2可知,
\delta J =  \int_{a}^{b} [\frac{\partial F}{\partial y}h + \frac{\partial F}{\partial y'}h'] \mathrm{d} x = 0

由上一节的Lemma 4可知,
\frac{\partial F}{\partial y}-\frac{\mathrm{d}}{\mathrm{d} x}\frac{\partial F}{\partial y'} = 0
这就是欧拉方程,下面我们整理下。

定理3:J[y]是下列形式的泛函:
J[y] = \int_{a}^{b} F(x, y, y') \mathrm{d} x
其中y(x)[a, b]上的连续可微泛函,满足y(a)=A, y(b)=B,函数F(x,y,y')是二阶可导的函数。在yJ[y]取到极值的必要条件其满足欧拉方程:
\frac{\partial F}{\partial y}-\frac{\mathrm{d}}{\mathrm{d} x}\frac{\partial F}{\partial y'} = 0

应用:两点之间直线最短。
这个是小学数学学得的知识,我们现在来形式化地证明一下。令a = 0, b = 1
F(x, y, y') = \sqrt{\sum_{i} (y'_i(x))^2}
那么J[y] = \int_{a}^{b} F(x, y, y') \mathrm{d} x就是连接两点A, B之间的曲线的长度,当J[y]取到最小值时,其也取到了极小值,由定理3,必满足欧拉方程:
\frac{\partial F}{\partial y}-\frac{\mathrm{d}}{\mathrm{d} x}\frac{\partial F}{\partial y'} = 0
那么我们有
\frac{\partial F}{\partial y}=0, \frac{\partial F}{\partial y'}=\frac{y'}{||y'||_{2}}
\frac{\mathrm{d}}{\mathrm{d} x}\frac{\partial F}{\partial y'}=0,则\frac{y'}{||y'||_{2}}=C,其中C是常值向量。可解得y'为常数,这是说y'x无关,则y'为常数,y为线性函数,即连接两点的直线。

实际上,该定理可以推广到黎曼流形上,得到连接两点的曲线满足的方程,我们称为测地线方程;从连接两点的最短曲线必为测地线的这个角度,测地线可以看做直线的推广(因为在欧式空间中,连接两点的最短曲线必为直线)。读者需要注意,反过来是不对的,在黎曼流形上,连接两点的最短曲线必为测地线,但任取一条测地线不一定最短(比如地球上沿东和沿西都可以从中国到美国,这两条都是测地线,但是只有一条最短)。这也是欧拉方程为必要不充分条件的一个直观表示。

评论

此博客中的热门博文

变分法基础(一)

变分法基础(二)