一、一阶微分方程组的标准形式# 含有 n n n 个未知函数 x 1 ( t ) , x 2 ( t ) , … , x n ( t ) x_1(t), x_2(t), \ldots, x_n(t) x 1 ( t ) , x 2 ( t ) , … , x n ( t ) 的 n n n 个一阶微分方程构成的一阶微分方程组,如果已经解出了一阶导数 d x 1 d t , … , d x n d t \frac{\mathrm{d}x_1}{\mathrm{d}t}, \ldots, \frac{\mathrm{d}x_n}{\mathrm{d}t} d t d x 1 , … , d t d x n ,则其标准形式可以写为:
{ d x 1 d t = f 1 ( t , x 1 , x 2 , … , x n ) d x 2 d t = f 2 ( t , x 1 , x 2 , … , x n ) ⋮ d x n d t = f n ( t , x 1 , x 2 , … , x n ) ( 3.1 ) \begin{cases}
\frac{\mathrm{d}x_1}{\mathrm{d}t} = f_1(t, x_1, x_2, \ldots, x_n) \\
\frac{\mathrm{d}x_2}{\mathrm{d}t} = f_2(t, x_1, x_2, \ldots, x_n) \\
\vdots \\
\frac{\mathrm{d}x_n}{\mathrm{d}t} = f_n(t, x_1, x_2, \ldots, x_n)
\end{cases}
\quad (3.1) ⎩ ⎨ ⎧ d t d x 1 = f 1 ( t , x 1 , x 2 , … , x n ) d t d x 2 = f 2 ( t , x 1 , x 2 , … , x n ) ⋮ d t d x n = f n ( t , x 1 , x 2 , … , x n ) ( 3.1 ) 其中 f i ( i = 1 , … , n ) f_i (i=1, \ldots, n) f i ( i = 1 , … , n ) 是定义在 ( n + 1 ) (n+1) ( n + 1 ) 维空间 ( t , x 1 , … , x n ) (t, x_1, \ldots, x_n) ( t , x 1 , … , x n ) 的某个区域 D D D 内的已知函数,t t t 是自变量。
为了书写方便,我们引入向量记号。令:
x ( t ) = ( x 1 ( t ) x 2 ( t ) ⋮ x n ( t ) ) , d x d t = ( d x 1 d t d x 2 d t ⋮ d x n d t ) , F ( t , x ) = ( f 1 ( t , x 1 , … , x n ) f 2 ( t , x 1 , … , x n ) ⋮ f n ( t , x 1 , … , x n ) ) \mathbf{x}(t) = \begin{pmatrix} x_1(t) \\ x_2(t) \\ \vdots \\ x_n(t) \end{pmatrix}, \quad
\frac{\mathrm{d}\mathbf{x}}{\mathrm{d}t} = \begin{pmatrix} \frac{\mathrm{d}x_1}{\mathrm{d}t} \\ \frac{\mathrm{d}x_2}{\mathrm{d}t} \\ \vdots \\ \frac{\mathrm{d}x_n}{\mathrm{d}t} \end{pmatrix}, \quad
\mathbf{F}(t, \mathbf{x}) = \begin{pmatrix} f_1(t, x_1, \ldots, x_n) \\ f_2(t, x_1, \ldots, x_n) \\ \vdots \\ f_n(t, x_1, \ldots, x_n) \end{pmatrix} x ( t ) = x 1 ( t ) x 2 ( t ) ⋮ x n ( t ) , d t d x = d t d x 1 d t d x 2 ⋮ d t d x n , F ( t , x ) = f 1 ( t , x 1 , … , x n ) f 2 ( t , x 1 , … , x n ) ⋮ f n ( t , x 1 , … , x n ) 则方程组可以简写为向量形式:
d x d t = F ( t , x ) \frac{\mathrm{d}\mathbf{x}}{\mathrm{d}t} = \mathbf{F}(t, \mathbf{x}) d t d x = F ( t , x )
二、线性一阶微分方程组的标准形式# 如果微分方程组 (3.1) 中的每一个函数 f i ( t , x 1 , … , x n ) ( i = 1 , … , n ) f_i(t, x_1, \ldots, x_n) (i=1, \ldots, n) f i ( t , x 1 , … , x n ) ( i = 1 , … , n ) 都是变量 x 1 , … , x n x_1, \ldots, x_n x 1 , … , x n 的线性函数,则称这种微分方程组为线性微分方程组,简称线性方程组。线性方程组的标准形式是:
d x i d t = ∑ j = 1 n a i j ( t ) x j + f i ( t ) , ( i = 1 , … , n ) \frac{\mathrm{d}x_i}{\mathrm{d}t} = \sum_{j=1}^n a_{ij}(t)x_j + f_i(t), \quad (i=1, \ldots, n) d t d x i = j = 1 ∑ n a ij ( t ) x j + f i ( t ) , ( i = 1 , … , n ) 其中 a i j ( t ) a_{ij}(t) a ij ( t ) 和 f i ( t ) f_i(t) f i ( t ) 是自变量 t t t 的已知函数,通常假定它们在某个区间 I = ( α , β ) I = (\alpha, \beta) I = ( α , β ) 上连续。
用向量和矩阵表示,令:
A ( t ) = ( a 11 ( t ) a 12 ( t ) ⋯ a 1 n ( t ) a 21 ( t ) a 22 ( t ) ⋯ a 2 n ( t ) ⋮ ⋮ ⋱ ⋮ a n 1 ( t ) a n 2 ( t ) ⋯ a n n ( t ) ) , f ( t ) = ( f 1 ( t ) f 2 ( t ) ⋮ f n ( t ) ) A(t) = \begin{pmatrix}
a_{11}(t) & a_{12}(t) & \cdots & a_{1n}(t) \\
a_{21}(t) & a_{22}(t) & \cdots & a_{2n}(t) \\
\vdots & \vdots & \ddots & \vdots \\
a_{n1}(t) & a_{n2}(t) & \cdots & a_{nn}(t)
\end{pmatrix}, \quad
\mathbf{f}(t) = \begin{pmatrix} f_1(t) \\ f_2(t) \\ \vdots \\ f_n(t) \end{pmatrix} A ( t ) = a 11 ( t ) a 21 ( t ) ⋮ a n 1 ( t ) a 12 ( t ) a 22 ( t ) ⋮ a n 2 ( t ) ⋯ ⋯ ⋱ ⋯ a 1 n ( t ) a 2 n ( t ) ⋮ a nn ( t ) , f ( t ) = f 1 ( t ) f 2 ( t ) ⋮ f n ( t ) 则上述线性方程组可以写成如下的向量形式:
d x d t = A ( t ) x + f ( t ) \frac{\mathrm{d}\mathbf{x}}{\mathrm{d}t} = A(t)\mathbf{x} + \mathbf{f}(t) d t d x = A ( t ) x + f ( t ) 这称为 非齐次线性微分方程组 。
四、常系数线性微分方程组解的一般理论# (注:以下大部分理论对变系数 A ( t ) A(t) A ( t ) 线性微分方程组也成立,除非特别指明是常系数 A A A 。)
考虑初值问题 (IVP):
d x d t = F ( t , x ) , x ( t 0 ) = x 0 \frac{\mathrm{d}\mathbf{x}}{\mathrm{d}t} = \mathbf{F}(t, \mathbf{x}), \quad \mathbf{x}(t_0) = \mathbf{x}_0 d t d x = F ( t , x ) , x ( t 0 ) = x 0 其中 t 0 t_0 t 0 是某个初始时刻,x 0 \mathbf{x}_0 x 0 是 n n n 维初始状态向量。
1、初值问题解的存在唯一性定理 (Picard-Lindelöf 定理)# 定理叙述 :
设向量函数 F ( t , x ) \mathbf{F}(t, \mathbf{x}) F ( t , x ) 在区域 R = { ( t , x ) : ∣ t − t 0 ∣ ≤ a , ∥ x − x 0 ∥ ≤ b } R = \{ (t, \mathbf{x}) : |t-t_0| \le a, \|\mathbf{x}-\mathbf{x}_0\| \le b \} R = {( t , x ) : ∣ t − t 0 ∣ ≤ a , ∥ x − x 0 ∥ ≤ b } (a > 0 , b > 0 a>0, b>0 a > 0 , b > 0 ) 上连续,并且关于 x \mathbf{x} x 满足 Lipschitz 条件,即存在常数 L > 0 L > 0 L > 0 ,使得对于 R R R 中的任意两点 ( t , x 1 ) (t, \mathbf{x}_1) ( t , x 1 ) 和 ( t , x 2 ) (t, \mathbf{x}_2) ( t , x 2 ) ,都有:
∥ F ( t , x 1 ) − F ( t , x 2 ) ∥ ≤ L ∥ x 1 − x 2 ∥ \|\mathbf{F}(t, \mathbf{x}_1) - \mathbf{F}(t, \mathbf{x}_2)\| \le L \|\mathbf{x}_1 - \mathbf{x}_2\| ∥ F ( t , x 1 ) − F ( t , x 2 ) ∥ ≤ L ∥ x 1 − x 2 ∥ (其中 ∥ ⋅ ∥ \|\cdot\| ∥ ⋅ ∥ 表示向量的某种范数,例如欧几里得范数或最大范数)。
则初值问题 d x d t = F ( t , x ) \frac{\mathrm{d}\mathbf{x}}{\mathrm{d}t} = \mathbf{F}(t, \mathbf{x}) d t d x = F ( t , x ) ,x ( t 0 ) = x 0 \mathbf{x}(t_0) = \mathbf{x}_0 x ( t 0 ) = x 0 在区间 I h = [ t 0 − h , t 0 + h ] I_h = [t_0-h, t_0+h] I h = [ t 0 − h , t 0 + h ] 上存在唯一的连续可微解 x ( t ) \mathbf{x}(t) x ( t ) ,其中 h = min ( a , b M ) h = \min\left(a, \frac{b}{M}\right) h = min ( a , M b ) ,M = max ( t , x ) ∈ R ∥ F ( t , x ) ∥ M = \max_{(t,\mathbf{x}) \in R} \|\mathbf{F}(t, \mathbf{x})\| M = max ( t , x ) ∈ R ∥ F ( t , x ) ∥ (由于 F \mathbf{F} F 连续, M M M 存在)。
证明 :
等价的积分方程 :
如果 x ( t ) \mathbf{x}(t) x ( t ) 是初值问题的一个解,那么对 d x d s = F ( s , x ( s ) ) \frac{\mathrm{d}\mathbf{x}}{\mathrm{d}s} = \mathbf{F}(s, \mathbf{x}(s)) d s d x = F ( s , x ( s )) 从 t 0 t_0 t 0 到 t t t 积分,并利用初始条件 x ( t 0 ) = x 0 \mathbf{x}(t_0) = \mathbf{x}_0 x ( t 0 ) = x 0 ,得到:
x ( t ) − x ( t 0 ) = ∫ t 0 t F ( s , x ( s ) ) d s \mathbf{x}(t) - \mathbf{x}(t_0) = \int_{t_0}^t \mathbf{F}(s, \mathbf{x}(s)) \mathrm{d}s x ( t ) − x ( t 0 ) = ∫ t 0 t F ( s , x ( s )) d s
x ( t ) = x 0 + ∫ t 0 t F ( s , x ( s ) ) d s ( ∗ ) \mathbf{x}(t) = \mathbf{x}_0 + \int_{t_0}^t \mathbf{F}(s, \mathbf{x}(s)) \mathrm{d}s \quad (*) x ( t ) = x 0 + ∫ t 0 t F ( s , x ( s )) d s ( ∗ )
反之,若连续函数 x ( t ) \mathbf{x}(t) x ( t ) 满足此积分方程,则 x ( t 0 ) = x 0 + ∫ t 0 t 0 F ( s , x ( s ) ) d s = x 0 \mathbf{x}(t_0) = \mathbf{x}_0 + \int_{t_0}^{t_0} \mathbf{F}(s, \mathbf{x}(s)) \mathrm{d}s = \mathbf{x}_0 x ( t 0 ) = x 0 + ∫ t 0 t 0 F ( s , x ( s )) d s = x 0 ,且对其求导(由于 F \mathbf{F} F 和 x \mathbf{x} x 连续,积分的被积函数连续,故可求导)得 d x d t = F ( t , x ( t ) ) \frac{\mathrm{d}\mathbf{x}}{\mathrm{d}t} = \mathbf{F}(t, \mathbf{x}(t)) d t d x = F ( t , x ( t )) 。因此,解初值问题等价于解此积分方程。
Picard 迭代序列 :
定义函数序列 { x k ( t ) } \{\mathbf{x}_k(t)\} { x k ( t )} 如下:
x 0 ( t ) = x 0 ( 常向量函数 ) \mathbf{x}_0(t) = \mathbf{x}_0 \quad (\text{常向量函数}) x 0 ( t ) = x 0 ( 常向量函数 )
x k + 1 ( t ) = x 0 + ∫ t 0 t F ( s , x k ( s ) ) d s , k = 0 , 1 , 2 , … \mathbf{x}_{k+1}(t) = \mathbf{x}_0 + \int_{t_0}^t \mathbf{F}(s, \mathbf{x}_k(s)) \mathrm{d}s, \quad k=0, 1, 2, \ldots x k + 1 ( t ) = x 0 + ∫ t 0 t F ( s , x k ( s )) d s , k = 0 , 1 , 2 , …
我们将在区间 I h = [ t 0 − h , t 0 + h ] I_h = [t_0-h, t_0+h] I h = [ t 0 − h , t 0 + h ] 上证明这个序列的收敛性,其中 h = min ( a , b / M ) h = \min(a, b/M) h = min ( a , b / M ) 。
迭代序列中的函数有定义且在 R R R 内 :
对于 t ∈ I h t \in I_h t ∈ I h (不妨设 t ≥ t 0 t \ge t_0 t ≥ t 0 , t ≤ t 0 t \le t_0 t ≤ t 0 的情况类似处理,只需将 ∣ t − t 0 ∣ |t-t_0| ∣ t − t 0 ∣ 代替 t − t 0 t-t_0 t − t 0 ):
当 k = 0 k=0 k = 0 ,x 0 ( t ) = x 0 \mathbf{x}_0(t) = \mathbf{x}_0 x 0 ( t ) = x 0 ,显然 ∥ x 0 ( t ) − x 0 ∥ = 0 ≤ b \|\mathbf{x}_0(t) - \mathbf{x}_0\| = 0 \le b ∥ x 0 ( t ) − x 0 ∥ = 0 ≤ b 。
x 1 ( t ) = x 0 + ∫ t 0 t F ( s , x 0 ( s ) ) d s \mathbf{x}_1(t) = \mathbf{x}_0 + \int_{t_0}^t \mathbf{F}(s, \mathbf{x}_0(s)) \mathrm{d}s x 1 ( t ) = x 0 + ∫ t 0 t F ( s , x 0 ( s )) d s 。
则
∥ x 1 ( t ) − x 0 ∥ = ∥ ∫ t 0 t F ( s , x 0 ) d s ∥ ≤ ∫ t 0 t ∥ F ( s , x 0 ) ∥ d s ≤ M ∣ t − t 0 ∣ ≤ M h ≤ M ⋅ b M = b \|\mathbf{x}_1(t) - \mathbf{x}_0\| = \left\| \int_{t_0}^t \mathbf{F}(s, \mathbf{x}_0) \mathrm{d}s \right\| \le \int_{t_0}^t \|\mathbf{F}(s, \mathbf{x}_0)\| \mathrm{d}s \le M |t-t_0| \le Mh \le M \cdot \frac{b}{M} = b ∥ x 1 ( t ) − x 0 ∥ = ∫ t 0 t F ( s , x 0 ) d s ≤ ∫ t 0 t ∥ F ( s , x 0 ) ∥ d s ≤ M ∣ t − t 0 ∣ ≤ M h ≤ M ⋅ M b = b
所以 x 1 ( t ) \mathbf{x}_1(t) x 1 ( t ) 的图像仍在 R R R 的 x \mathbf{x} x 范围内。
假设 x k ( t ) \mathbf{x}_k(t) x k ( t ) 对 t ∈ I h t \in I_h t ∈ I h 都有 ∥ x k ( t ) − x 0 ∥ ≤ b \|\mathbf{x}_k(t) - \mathbf{x}_0\| \le b ∥ x k ( t ) − x 0 ∥ ≤ b 。那么 F ( s , x k ( s ) ) \mathbf{F}(s, \mathbf{x}_k(s)) F ( s , x k ( s )) 有定义。
则
∥ x k + 1 ( t ) − x 0 ∥ = ∥ ∫ t 0 t F ( s , x k ( s ) ) d s ∥ ≤ ∫ t 0 t ∥ F ( s , x k ( s ) ) ∥ d s ≤ M ∣ t − t 0 ∣ ≤ M h ≤ b \|\mathbf{x}_{k+1}(t) - \mathbf{x}_0\| = \left\| \int_{t_0}^t \mathbf{F}(s, \mathbf{x}_k(s)) \mathrm{d}s \right\| \le \int_{t_0}^t \|\mathbf{F}(s, \mathbf{x}_k(s))\| \mathrm{d}s \le M|t-t_0| \le Mh \le b ∥ x k + 1 ( t ) − x 0 ∥ = ∫ t 0 t F ( s , x k ( s )) d s ≤ ∫ t 0 t ∥ F ( s , x k ( s )) ∥ d s ≤ M ∣ t − t 0 ∣ ≤ M h ≤ b
由数学归纳法,所有 x k ( t ) \mathbf{x}_k(t) x k ( t ) 在 I h I_h I h 上有定义,且其值满足 ∥ x k ( t ) − x 0 ∥ ≤ b \|\mathbf{x}_k(t) - \mathbf{x}_0\| \le b ∥ x k ( t ) − x 0 ∥ ≤ b 。
序列的收敛性 :
考虑级数 x 0 ( t ) + ∑ k = 0 ∞ ( x k + 1 ( t ) − x k ( t ) ) \mathbf{x}_0(t) + \sum_{k=0}^{\infty} (\mathbf{x}_{k+1}(t) - \mathbf{x}_k(t)) x 0 ( t ) + ∑ k = 0 ∞ ( x k + 1 ( t ) − x k ( t )) 。如果此级数收敛,则其部分和序列 x m ( t ) = x 0 ( t ) + ∑ k = 0 m − 1 ( x k + 1 ( t ) − x k ( t ) ) \mathbf{x}_m(t) = \mathbf{x}_0(t) + \sum_{k=0}^{m-1} (\mathbf{x}_{k+1}(t) - \mathbf{x}_k(t)) x m ( t ) = x 0 ( t ) + ∑ k = 0 m − 1 ( x k + 1 ( t ) − x k ( t )) 收敛。
我们来估计 ∥ x k + 1 ( t ) − x k ( t ) ∥ \|\mathbf{x}_{k+1}(t) - \mathbf{x}_k(t)\| ∥ x k + 1 ( t ) − x k ( t ) ∥ 。
对于 t ∈ I h t \in I_h t ∈ I h (同样设 t ≥ t 0 t \ge t_0 t ≥ t 0 ):
∥ x 1 ( t ) − x 0 ( t ) ∥ = ∥ ∫ t 0 t F ( s , x 0 ) d s ∥ ≤ M ( t − t 0 ) \|\mathbf{x}_1(t) - \mathbf{x}_0(t)\| = \left\| \int_{t_0}^t \mathbf{F}(s, \mathbf{x}_0) \mathrm{d}s \right\| \le M(t-t_0) ∥ x 1 ( t ) − x 0 ( t ) ∥ = ∫ t 0 t F ( s , x 0 ) d s ≤ M ( t − t 0 )
∥ x 2 ( t ) − x 1 ( t ) ∥ = ∥ ∫ t 0 t ( F ( s , x 1 ( s ) ) − F ( s , x 0 ( s ) ) ) d s ∥ \|\mathbf{x}_2(t) - \mathbf{x}_1(t)\| = \left\| \int_{t_0}^t (\mathbf{F}(s, \mathbf{x}_1(s)) - \mathbf{F}(s, \mathbf{x}_0(s))) \mathrm{d}s \right\| ∥ x 2 ( t ) − x 1 ( t ) ∥ = ∫ t 0 t ( F ( s , x 1 ( s )) − F ( s , x 0 ( s ))) d s
≤ ∫ t 0 t ∥ F ( s , x 1 ( s ) ) − F ( s , x 0 ( s ) ) ∥ d s \le \int_{t_0}^t \|\mathbf{F}(s, \mathbf{x}_1(s)) - \mathbf{F}(s, \mathbf{x}_0(s))\| \mathrm{d}s ≤ ∫ t 0 t ∥ F ( s , x 1 ( s )) − F ( s , x 0 ( s )) ∥ d s
≤ ∫ t 0 t L ∥ x 1 ( s ) − x 0 ( s ) ∥ d s \le \int_{t_0}^t L \|\mathbf{x}_1(s) - \mathbf{x}_0(s)\| \mathrm{d}s ≤ ∫ t 0 t L ∥ x 1 ( s ) − x 0 ( s ) ∥ d s
≤ ∫ t 0 t L ⋅ M ( s − t 0 ) d s = L M ∫ t 0 t ( s − t 0 ) d s = L M ( t − t 0 ) 2 2 ! \le \int_{t_0}^t L \cdot M(s-t_0) \mathrm{d}s = LM \int_{t_0}^t (s-t_0) \mathrm{d}s = LM \frac{(t-t_0)^2}{2!} ≤ ∫ t 0 t L ⋅ M ( s − t 0 ) d s = L M ∫ t 0 t ( s − t 0 ) d s = L M 2 ! ( t − t 0 ) 2
一般地,假设 ∥ x k ( t ) − x k − 1 ( t ) ∥ ≤ M L k − 1 ( t − t 0 ) k k ! \|\mathbf{x}_k(t) - \mathbf{x}_{k-1}(t)\| \le M L^{k-1} \frac{(t-t_0)^k}{k!} ∥ x k ( t ) − x k − 1 ( t ) ∥ ≤ M L k − 1 k ! ( t − t 0 ) k 。则
∥ x k + 1 ( t ) − x k ( t ) ∥ = ∥ ∫ t 0 t ( F ( s , x k ( s ) ) − F ( s , x k − 1 ( s ) ) ) d s ∥ \|\mathbf{x}_{k+1}(t) - \mathbf{x}_k(t)\| = \left\| \int_{t_0}^t (\mathbf{F}(s, \mathbf{x}_k(s)) - \mathbf{F}(s, \mathbf{x}_{k-1}(s))) \mathrm{d}s \right\| ∥ x k + 1 ( t ) − x k ( t ) ∥ = ∫ t 0 t ( F ( s , x k ( s )) − F ( s , x k − 1 ( s ))) d s
≤ ∫ t 0 t L ∥ x k ( s ) − x k − 1 ( s ) ∥ d s \le \int_{t_0}^t L \|\mathbf{x}_k(s) - \mathbf{x}_{k-1}(s)\| \mathrm{d}s ≤ ∫ t 0 t L ∥ x k ( s ) − x k − 1 ( s ) ∥ d s
≤ ∫ t 0 t L ⋅ M L k − 1 ( s − t 0 ) k k ! d s = M L k ∫ t 0 t ( s − t 0 ) k k ! d s = M L k ( t − t 0 ) k + 1 ( k + 1 ) ! \le \int_{t_0}^t L \cdot M L^{k-1} \frac{(s-t_0)^k}{k!} \mathrm{d}s = M L^k \int_{t_0}^t \frac{(s-t_0)^k}{k!} \mathrm{d}s = M L^k \frac{(t-t_0)^{k+1}}{(k+1)!} ≤ ∫ t 0 t L ⋅ M L k − 1 k ! ( s − t 0 ) k d s = M L k ∫ t 0 t k ! ( s − t 0 ) k d s = M L k ( k + 1 )! ( t − t 0 ) k + 1
这个归纳对 ∣ t − t 0 ∣ |t-t_0| ∣ t − t 0 ∣ 也成立,即:
∥ x k + 1 ( t ) − x k ( t ) ∥ ≤ M L k ∣ t − t 0 ∣ k + 1 ( k + 1 ) ! ≤ M L k h k + 1 ( k + 1 ) ! = M L ( L h ) k + 1 ( k + 1 ) ! \|\mathbf{x}_{k+1}(t) - \mathbf{x}_k(t)\| \le M L^k \frac{|t-t_0|^{k+1}}{(k+1)!} \le M L^k \frac{h^{k+1}}{(k+1)!} = \frac{M}{L} \frac{(Lh)^{k+1}}{(k+1)!} ∥ x k + 1 ( t ) − x k ( t ) ∥ ≤ M L k ( k + 1 )! ∣ t − t 0 ∣ k + 1 ≤ M L k ( k + 1 )! h k + 1 = L M ( k + 1 )! ( L h ) k + 1
考虑级数 ∑ k = 0 ∞ ∥ x k + 1 ( t ) − x k ( t ) ∥ \sum_{k=0}^{\infty} \|\mathbf{x}_{k+1}(t) - \mathbf{x}_k(t)\| ∑ k = 0 ∞ ∥ x k + 1 ( t ) − x k ( t ) ∥ . 其各项由 ∑ k = 0 ∞ M L ( L h ) k + 1 ( k + 1 ) ! \sum_{k=0}^{\infty} \frac{M}{L} \frac{(Lh)^{k+1}}{(k+1)!} ∑ k = 0 ∞ L M ( k + 1 )! ( L h ) k + 1 控制。这个级数是收敛的,因为 ∑ j = 1 ∞ M L ( L h ) j j ! = M L ( e L h − 1 ) \sum_{j=1}^{\infty} \frac{M}{L} \frac{(Lh)^j}{j!} = \frac{M}{L} (e^{Lh} - 1) ∑ j = 1 ∞ L M j ! ( L h ) j = L M ( e L h − 1 ) 。根据 Weierstrass M-判别法,向量函数级数 x 0 ( t ) + ∑ k = 0 ∞ ( x k + 1 ( t ) − x k ( t ) ) \mathbf{x}_0(t) + \sum_{k=0}^{\infty} (\mathbf{x}_{k+1}(t) - \mathbf{x}_k(t)) x 0 ( t ) + ∑ k = 0 ∞ ( x k + 1 ( t ) − x k ( t )) 在 I h I_h I h 上一致收敛。记其极限函数为 x ( t ) = lim k → ∞ x k ( t ) \mathbf{x}(t) = \lim_{k \to \infty} \mathbf{x}_k(t) x ( t ) = lim k → ∞ x k ( t ) 。由于 x k ( t ) \mathbf{x}_k(t) x k ( t ) 都是连续函数,且级数一致收敛,所以 x ( t ) \mathbf{x}(t) x ( t ) 在 I h I_h I h 上连续。同时,由于对所有 k k k 和 t ∈ I h t \in I_h t ∈ I h ,∥ x k ( t ) − x 0 ∥ ≤ b \|\mathbf{x}_k(t) - \mathbf{x}_0\| \le b ∥ x k ( t ) − x 0 ∥ ≤ b ,取极限后 ∥ x ( t ) − x 0 ∥ ≤ b \|\mathbf{x}(t) - \mathbf{x}_0\| \le b ∥ x ( t ) − x 0 ∥ ≤ b 。
极限函数是解 :
我们有 x k + 1 ( t ) = x 0 + ∫ t 0 t F ( s , x k ( s ) ) d s \mathbf{x}_{k+1}(t) = \mathbf{x}_0 + \int_{t_0}^t \mathbf{F}(s, \mathbf{x}_k(s)) \mathrm{d}s x k + 1 ( t ) = x 0 + ∫ t 0 t F ( s , x k ( s )) d s 。当 k → ∞ k \to \infty k → ∞ 时,x k + 1 ( t ) → x ( t ) \mathbf{x}_{k+1}(t) \to \mathbf{x}(t) x k + 1 ( t ) → x ( t ) 。
我们需要证明
lim k → ∞ ∫ t 0 t F ( s , x k ( s ) ) d s = ∫ t 0 t F ( s , x ( s ) ) d s \lim_{k \to \infty} \int_{t_0}^t \mathbf{F}(s, \mathbf{x}_k(s)) \mathrm{d}s = \int_{t_0}^t \mathbf{F}(s, \mathbf{x}(s)) \mathrm{d}s k → ∞ lim ∫ t 0 t F ( s , x k ( s )) d s = ∫ t 0 t F ( s , x ( s )) d s
考虑差值:
∥ ∫ t 0 t F ( s , x k ( s ) ) d s − ∫ t 0 t F ( s , x ( s ) ) d s ∥ ≤ ∫ t 0 t ∥ F ( s , x k ( s ) ) − F ( s , x ( s ) ) ∥ d s \left\| \int_{t_0}^t \mathbf{F}(s, \mathbf{x}_k(s)) \mathrm{d}s - \int_{t_0}^t \mathbf{F}(s, \mathbf{x}(s)) \mathrm{d}s \right\| \le \int_{t_0}^t \|\mathbf{F}(s, \mathbf{x}_k(s)) - \mathbf{F}(s, \mathbf{x}(s))\| \mathrm{d}s ∫ t 0 t F ( s , x k ( s )) d s − ∫ t 0 t F ( s , x ( s )) d s ≤ ∫ t 0 t ∥ F ( s , x k ( s )) − F ( s , x ( s )) ∥ d s
≤ ∫ t 0 t L ∥ x k ( s ) − x ( s ) ∥ d s \le \int_{t_0}^t L \|\mathbf{x}_k(s) - \mathbf{x}(s)\| \mathrm{d}s ≤ ∫ t 0 t L ∥ x k ( s ) − x ( s ) ∥ d s
由于 x k ( s ) \mathbf{x}_k(s) x k ( s ) 在 I h I_h I h 上一致收敛到 x ( s ) \mathbf{x}(s) x ( s ) ,对任意 ϵ > 0 \epsilon > 0 ϵ > 0 ,存在 N N N ,当 k > N k > N k > N 时,∥ x k ( s ) − x ( s ) ∥ < ϵ / ( L h ) \|\mathbf{x}_k(s) - \mathbf{x}(s)\| < \epsilon / (Lh) ∥ x k ( s ) − x ( s ) ∥ < ϵ / ( L h ) 对所有 s ∈ I h s \in I_h s ∈ I h 成立。
所以上式
≤ ∫ t 0 t L ϵ L h d s = ϵ h ∣ t − t 0 ∣ ≤ ϵ \le \int_{t_0}^t L \frac{\epsilon}{Lh} \mathrm{d}s = \frac{\epsilon}{h} |t-t_0| \le \epsilon ≤ ∫ t 0 t L L h ϵ d s = h ϵ ∣ t − t 0 ∣ ≤ ϵ
因此
lim k → ∞ ∫ t 0 t F ( s , x k ( s ) ) d s = ∫ t 0 t F ( s , x ( s ) ) d s \lim_{k \to \infty} \int_{t_0}^t \mathbf{F}(s, \mathbf{x}_k(s)) \mathrm{d}s = \int_{t_0}^t \mathbf{F}(s, \mathbf{x}(s)) \mathrm{d}s k → ∞ lim ∫ t 0 t F ( s , x k ( s )) d s = ∫ t 0 t F ( s , x ( s )) d s
取极限得到:
x ( t ) = x 0 + ∫ t 0 t F ( s , x ( s ) ) d s \mathbf{x}(t) = \mathbf{x}_0 + \int_{t_0}^t \mathbf{F}(s, \mathbf{x}(s)) \mathrm{d}s x ( t ) = x 0 + ∫ t 0 t F ( s , x ( s )) d s
这表明 x ( t ) \mathbf{x}(t) x ( t ) 是积分方程的解,从而也是初值问题的解。
解的唯一性 :
假设存在两个解 x ( t ) \mathbf{x}(t) x ( t ) 和 y ( t ) \mathbf{y}(t) y ( t ) 满足初值问题,且都在某个区间 J ⊆ I h J \subseteq I_h J ⊆ I h 上有定义。
则它们都满足积分方程:
x ( t ) = x 0 + ∫ t 0 t F ( s , x ( s ) ) d s \mathbf{x}(t) = \mathbf{x}_0 + \int_{t_0}^t \mathbf{F}(s, \mathbf{x}(s)) \mathrm{d}s x ( t ) = x 0 + ∫ t 0 t F ( s , x ( s )) d s
y ( t ) = x 0 + ∫ t 0 t F ( s , y ( s ) ) d s \mathbf{y}(t) = \mathbf{x}_0 + \int_{t_0}^t \mathbf{F}(s, \mathbf{y}(s)) \mathrm{d}s y ( t ) = x 0 + ∫ t 0 t F ( s , y ( s )) d s
令 z ( t ) = x ( t ) − y ( t ) \mathbf{z}(t) = \mathbf{x}(t) - \mathbf{y}(t) z ( t ) = x ( t ) − y ( t ) 。则 z ( t 0 ) = 0 \mathbf{z}(t_0) = \mathbf{0} z ( t 0 ) = 0 。
∥ z ( t ) ∥ = ∥ x ( t ) − y ( t ) ∥ = ∥ ∫ t 0 t ( F ( s , x ( s ) ) − F ( s , y ( s ) ) ) d s ∥ \|\mathbf{z}(t)\| = \|\mathbf{x}(t) - \mathbf{y}(t)\| = \left\| \int_{t_0}^t (\mathbf{F}(s, \mathbf{x}(s)) - \mathbf{F}(s, \mathbf{y}(s))) \mathrm{d}s \right\| ∥ z ( t ) ∥ = ∥ x ( t ) − y ( t ) ∥ = ∫ t 0 t ( F ( s , x ( s )) − F ( s , y ( s ))) d s
≤ ∫ t 0 t ∥ F ( s , x ( s ) ) − F ( s , y ( s ) ) ∥ d s \le \int_{t_0}^t \|\mathbf{F}(s, \mathbf{x}(s)) - \mathbf{F}(s, \mathbf{y}(s))\| \mathrm{d}s ≤ ∫ t 0 t ∥ F ( s , x ( s )) − F ( s , y ( s )) ∥ d s
≤ ∫ t 0 t L ∥ x ( s ) − y ( s ) ∥ d s = L ∫ t 0 t ∥ z ( s ) ∥ d s ( 设 t ≥ t 0 ) \le \int_{t_0}^t L \|\mathbf{x}(s) - \mathbf{y}(s)\| \mathrm{d}s = L \int_{t_0}^t \|\mathbf{z}(s)\| \mathrm{d}s \quad (\text{设 } t \ge t_0) ≤ ∫ t 0 t L ∥ x ( s ) − y ( s ) ∥ d s = L ∫ t 0 t ∥ z ( s ) ∥ d s ( 设 t ≥ t 0 )
令 ϕ ( t ) = ∫ t 0 t ∥ z ( s ) ∥ d s \phi(t) = \int_{t_0}^t \|\mathbf{z}(s)\| \mathrm{d}s ϕ ( t ) = ∫ t 0 t ∥ z ( s ) ∥ d s 。则 ϕ ( t 0 ) = 0 \phi(t_0)=0 ϕ ( t 0 ) = 0 且 ϕ ( t ) ≥ 0 \phi(t) \ge 0 ϕ ( t ) ≥ 0 。
我们有 ∥ z ( t ) ∥ ≤ L ϕ ( t ) \|\mathbf{z}(t)\| \le L \phi(t) ∥ z ( t ) ∥ ≤ L ϕ ( t ) 。
所以 ϕ ′ ( t ) = ∥ z ( t ) ∥ ≤ L ϕ ( t ) \phi'(t) = \|\mathbf{z}(t)\| \le L \phi(t) ϕ ′ ( t ) = ∥ z ( t ) ∥ ≤ L ϕ ( t ) 。
即 ϕ ′ ( t ) − L ϕ ( t ) ≤ 0 \phi'(t) - L\phi(t) \le 0 ϕ ′ ( t ) − L ϕ ( t ) ≤ 0 。
乘以 e − L ( t − t 0 ) e^{-L(t-t_0)} e − L ( t − t 0 ) (这是一个积分因子):
e − L ( t − t 0 ) ϕ ′ ( t ) − L e − L ( t − t 0 ) ϕ ( t ) ≤ 0 e^{-L(t-t_0)}\phi'(t) - L e^{-L(t-t_0)}\phi(t) \le 0 e − L ( t − t 0 ) ϕ ′ ( t ) − L e − L ( t − t 0 ) ϕ ( t ) ≤ 0
d d t ( e − L ( t − t 0 ) ϕ ( t ) ) ≤ 0 \frac{\mathrm{d}}{\mathrm{d}t} (e^{-L(t-t_0)}\phi(t)) \le 0 d t d ( e − L ( t − t 0 ) ϕ ( t )) ≤ 0
对 s s s 从 t 0 t_0 t 0 到 t t t 积分:
∫ t 0 t d d s ( e − L ( s − t 0 ) ϕ ( s ) ) d s ≤ ∫ t 0 t 0 d s = 0 \int_{t_0}^t \frac{\mathrm{d}}{\mathrm{d}s} (e^{-L(s-t_0)}\phi(s)) \mathrm{d}s \le \int_{t_0}^t 0 \mathrm{d}s = 0 ∫ t 0 t d s d ( e − L ( s − t 0 ) ϕ ( s )) d s ≤ ∫ t 0 t 0 d s = 0
e − L ( t − t 0 ) ϕ ( t ) − e 0 ϕ ( t 0 ) ≤ 0 e^{-L(t-t_0)}\phi(t) - e^0 \phi(t_0) \le 0 e − L ( t − t 0 ) ϕ ( t ) − e 0 ϕ ( t 0 ) ≤ 0
由于 ϕ ( t 0 ) = 0 \phi(t_0)=0 ϕ ( t 0 ) = 0 ,得到 e − L ( t − t 0 ) ϕ ( t ) ≤ 0 e^{-L(t-t_0)}\phi(t) \le 0 e − L ( t − t 0 ) ϕ ( t ) ≤ 0 。
因为 e − L ( t − t 0 ) > 0 e^{-L(t-t_0)} > 0 e − L ( t − t 0 ) > 0 且 ϕ ( t ) ≥ 0 \phi(t) \ge 0 ϕ ( t ) ≥ 0 ,这只可能当 ϕ ( t ) = 0 \phi(t) = 0 ϕ ( t ) = 0 对所有 t ≥ t 0 t \ge t_0 t ≥ t 0 (在 J J J 内) 成立。
如果 ϕ ( t ) = ∫ t 0 t ∥ z ( s ) ∥ d s = 0 \phi(t) = \int_{t_0}^t \|\mathbf{z}(s)\| \mathrm{d}s = 0 ϕ ( t ) = ∫ t 0 t ∥ z ( s ) ∥ d s = 0 且 ∥ z ( s ) ∥ ≥ 0 \|\mathbf{z}(s)\| \ge 0 ∥ z ( s ) ∥ ≥ 0 且连续,则必须有 ∥ z ( s ) ∥ = 0 \|\mathbf{z}(s)\| = 0 ∥ z ( s ) ∥ = 0 对所有 s s s 。
即 ∥ x ( s ) − y ( s ) ∥ = 0 \|\mathbf{x}(s) - \mathbf{y}(s)\| = 0 ∥ x ( s ) − y ( s ) ∥ = 0 ,所以 x ( s ) = y ( s ) \mathbf{x}(s) = \mathbf{y}(s) x ( s ) = y ( s ) 。
对于 t < t 0 t < t_0 t < t 0 的情况,可以类似地考虑 ∫ t t 0 ∥ z ( s ) ∥ d s \int_t^{t_0} \|\mathbf{z}(s)\| \mathrm{d}s ∫ t t 0 ∥ z ( s ) ∥ d s 或使用 Gronwall 不等式的其他形式。
因此解是唯一的。
(注:这里使用了 Gronwall 不等式的一个简单形式的推导。)
4.2 推论 (针对线性系统)# 对于线性微分方程组
d x d t = A ( t ) x + f ( t ) \frac{\mathrm{d}\mathbf{x}}{\mathrm{d}t} = A(t)\mathbf{x} + \mathbf{f}(t) d t d x = A ( t ) x + f ( t ) 如果 A ( t ) A(t) A ( t ) 和 f ( t ) \mathbf{f}(t) f ( t ) 在区间 I = ( α , β ) I = (\alpha, \beta) I = ( α , β ) 上连续,那么 F ( t , x ) = A ( t ) x + f ( t ) \mathbf{F}(t, \mathbf{x}) = A(t)\mathbf{x} + \mathbf{f}(t) F ( t , x ) = A ( t ) x + f ( t ) 在 I × R n I \times \mathbb{R}^n I × R n 上连续。
并且,对于任意 ( t , x 1 ) (t, \mathbf{x}_1) ( t , x 1 ) 和 ( t , x 2 ) (t, \mathbf{x}_2) ( t , x 2 ) 属于 I × R n I \times \mathbb{R}^n I × R n :
∥ F ( t , x 1 ) − F ( t , x 2 ) ∥ = ∥ ( A ( t ) x 1 + f ( t ) ) − ( A ( t ) x 2 + f ( t ) ) ∥ \|\mathbf{F}(t, \mathbf{x}_1) - \mathbf{F}(t, \mathbf{x}_2)\| = \|(A(t)\mathbf{x}_1 + \mathbf{f}(t)) - (A(t)\mathbf{x}_2 + \mathbf{f}(t))\| ∥ F ( t , x 1 ) − F ( t , x 2 ) ∥ = ∥ ( A ( t ) x 1 + f ( t )) − ( A ( t ) x 2 + f ( t )) ∥ = ∥ A ( t ) ( x 1 − x 2 ) ∥ ≤ ∥ A ( t ) ∥ ∥ x 1 − x 2 ∥ = \|A(t)(\mathbf{x}_1 - \mathbf{x}_2)\| \le \|A(t)\| \|\mathbf{x}_1 - \mathbf{x}_2\| = ∥ A ( t ) ( x 1 − x 2 ) ∥ ≤ ∥ A ( t ) ∥∥ x 1 − x 2 ∥ 如果在区间 I I I 的任何闭子区间 J = [ c , d ] ⊂ I J = [c, d] \subset I J = [ c , d ] ⊂ I 上,A ( t ) A(t) A ( t ) 是连续的,那么矩阵范数 ∥ A ( t ) ∥ \|A(t)\| ∥ A ( t ) ∥ 在 J J J 上有界,设为 L J = max t ∈ J ∥ A ( t ) ∥ L_J = \max_{t \in J} \|A(t)\| L J = max t ∈ J ∥ A ( t ) ∥ 。
此时,Lipschitz 条件在 J × R n J \times \mathbb{R}^n J × R n 上成立,Lipschitz 常数为 L J L_J L J 。
这意味着对于线性系统,如果系数矩阵 A ( t ) A(t) A ( t ) 和非齐次项 f ( t ) \mathbf{f}(t) f ( t ) 在区间 I I I 上连续,那么对任意 t 0 ∈ I t_0 \in I t 0 ∈ I 和任意初始值 x 0 ∈ R n \mathbf{x}_0 \in \mathbb{R}^n x 0 ∈ R n ,初值问题的解在整个区间 I I I 上存在且唯一。
(这里 b b b 可以取任意大,所以 h = min ( a , b / M ) h = \min(a, b/M) h = min ( a , b / M ) 中的 b / M b/M b / M 项不再是限制因素,只要 a a a 能覆盖整个区间 I I I 即可。)
4.3 向量函数的朗斯基行列式 (Wronskian)# 考虑齐次线性方程组 d x d t = A ( t ) x \frac{\mathrm{d}\mathbf{x}}{\mathrm{d}t} = A(t)\mathbf{x} d t d x = A ( t ) x 。
设有 n n n 个解 x ( 1 ) ( t ) , x ( 2 ) ( t ) , … , x ( n ) ( t ) \mathbf{x}^{(1)}(t), \mathbf{x}^{(2)}(t), \ldots, \mathbf{x}^{(n)}(t) x ( 1 ) ( t ) , x ( 2 ) ( t ) , … , x ( n ) ( t ) 。这些解都是 n n n 维列向量。
我们可以将它们并列构成一个 n × n n \times n n × n 的矩阵,称为解矩阵 X ( t ) \mathbf{X}(t) X ( t ) :
X ( t ) = [ x ( 1 ) ( t ) x ( 2 ) ( t ) ⋯ x ( n ) ( t ) ] = ( x 1 ( 1 ) ( t ) x 1 ( 2 ) ( t ) ⋯ x 1 ( n ) ( t ) x 2 ( 1 ) ( t ) x 2 ( 2 ) ( t ) ⋯ x 2 ( n ) ( t ) ⋮ ⋮ ⋱ ⋮ x n ( 1 ) ( t ) x n ( 2 ) ( t ) ⋯ x n ( n ) ( t ) ) \mathbf{X}(t) = [\mathbf{x}^{(1)}(t) \quad \mathbf{x}^{(2)}(t) \quad \cdots \quad \mathbf{x}^{(n)}(t)] =
\begin{pmatrix}
x_{1}^{(1)}(t) & x_{1}^{(2)}(t) & \cdots & x_{1}^{(n)}(t) \\
x_{2}^{(1)}(t) & x_{2}^{(2)}(t) & \cdots & x_{2}^{(n)}(t) \\
\vdots & \vdots & \ddots & \vdots \\
x_{n}^{(1)}(t) & x_{n}^{(2)}(t) & \cdots & x_{n}^{(n)}(t)
\end{pmatrix} X ( t ) = [ x ( 1 ) ( t ) x ( 2 ) ( t ) ⋯ x ( n ) ( t )] = x 1 ( 1 ) ( t ) x 2 ( 1 ) ( t ) ⋮ x n ( 1 ) ( t ) x 1 ( 2 ) ( t ) x 2 ( 2 ) ( t ) ⋮ x n ( 2 ) ( t ) ⋯ ⋯ ⋱ ⋯ x 1 ( n ) ( t ) x 2 ( n ) ( t ) ⋮ x n ( n ) ( t ) 其中 x i ( j ) ( t ) x_i^{(j)}(t) x i ( j ) ( t ) 表示第 j j j 个解向量的第 i i i 个分量。
定义 :这 n n n 个解 x ( 1 ) ( t ) , … , x ( n ) ( t ) \mathbf{x}^{(1)}(t), \ldots, \mathbf{x}^{(n)}(t) x ( 1 ) ( t ) , … , x ( n ) ( t ) 的朗斯基行列式 (Wronskian) 定义为:
W ( t ) = W ( x ( 1 ) , … , x ( n ) ) ( t ) = det ( X ( t ) ) W(t) = W(\mathbf{x}^{(1)}, \ldots, \mathbf{x}^{(n)})(t) = \det(\mathbf{X}(t)) W ( t ) = W ( x ( 1 ) , … , x ( n ) ) ( t ) = det ( X ( t )) Abel 公式 (Liouville 公式) :
朗斯基行列式 W ( t ) W(t) W ( t ) 满足一阶线性微分方程:
d W d t = t r ( A ( t ) ) W ( t ) \frac{\mathrm{d}W}{\mathrm{d}t} = \mathrm{tr}(A(t)) W(t) d t d W = tr ( A ( t )) W ( t ) 其中 t r ( A ( t ) ) = ∑ i = 1 n a i i ( t ) \mathrm{tr}(A(t)) = \sum_{i=1}^n a_{ii}(t) tr ( A ( t )) = ∑ i = 1 n a ii ( t ) 是矩阵 A ( t ) A(t) A ( t ) 的迹。
解这个方程得到:
W ( t ) = W ( t 0 ) exp ( ∫ t 0 t t r ( A ( s ) ) d s ) W(t) = W(t_0) \exp\left(\int_{t_0}^t \mathrm{tr}(A(s)) \mathrm{d}s\right) W ( t ) = W ( t 0 ) exp ( ∫ t 0 t tr ( A ( s )) d s ) 证明 Abel 公式 :
设 X ( t ) = [ x ( 1 ) ( t ) … x ( n ) ( t ) ] \mathbf{X}(t) = [\mathbf{x}^{(1)}(t) \quad \dots \quad \mathbf{x}^{(n)}(t)] X ( t ) = [ x ( 1 ) ( t ) … x ( n ) ( t )] 。
根据行列式导数的性质(对列向量函数求导):
d W d t = d d t det [ x ( 1 ) ( t ) … x ( n ) ( t ) ] = ∑ k = 1 n det [ x ( 1 ) ( t ) … d x ( k ) ( t ) d t … x ( n ) ( t ) ] \frac{\mathrm{d}W}{\mathrm{d}t} = \frac{\mathrm{d}}{\mathrm{d}t} \det[\mathbf{x}^{(1)}(t) \quad \dots \quad \mathbf{x}^{(n)}(t)] = \sum_{k=1}^n \det[\mathbf{x}^{(1)}(t) \quad \dots \quad \frac{\mathrm{d}\mathbf{x}^{(k)}(t)}{\mathrm{d}t} \quad \dots \quad \mathbf{x}^{(n)}(t)] d t d W = d t d det [ x ( 1 ) ( t ) … x ( n ) ( t )] = k = 1 ∑ n det [ x ( 1 ) ( t ) … d t d x ( k ) ( t ) … x ( n ) ( t )] 由于每个 x ( k ) ( t ) \mathbf{x}^{(k)}(t) x ( k ) ( t ) 都是方程 d x d t = A ( t ) x \frac{\mathrm{d}\mathbf{x}}{\mathrm{d}t} = A(t)\mathbf{x} d t d x = A ( t ) x 的解,所以 d x ( k ) d t = A ( t ) x ( k ) ( t ) \frac{\mathrm{d}\mathbf{x}^{(k)}}{\mathrm{d}t} = A(t)\mathbf{x}^{(k)}(t) d t d x ( k ) = A ( t ) x ( k ) ( t ) 。
代入上式:
d W d t = ∑ k = 1 n det [ x ( 1 ) ( t ) … A ( t ) x ( k ) ( t ) … x ( n ) ( t ) ] \frac{\mathrm{d}W}{\mathrm{d}t} = \sum_{k=1}^n \det[\mathbf{x}^{(1)}(t) \quad \dots \quad A(t)\mathbf{x}^{(k)}(t) \quad \dots \quad \mathbf{x}^{(n)}(t)] d t d W = k = 1 ∑ n det [ x ( 1 ) ( t ) … A ( t ) x ( k ) ( t ) … x ( n ) ( t )] 我们使用一个关于行列式和矩阵迹的恒等式:对于任意 n × n n \times n n × n 矩阵 M = [ m 1 … m n ] M = [\mathbf{m}_1 \quad \dots \quad \mathbf{m}_n] M = [ m 1 … m n ] 和任意 n × n n \times n n × n 矩阵 A A A ,有
∑ k = 1 n det [ m 1 … A m k … m n ] = t r ( A ) det ( M ) \sum_{k=1}^n \det[\mathbf{m}_1 \quad \dots \quad A\mathbf{m}_k \quad \dots \quad \mathbf{m}_n] = \mathrm{tr}(A) \det(M) k = 1 ∑ n det [ m 1 … A m k … m n ] = tr ( A ) det ( M ) (此恒等式的证明:若 M = I M=I M = I (单位矩阵),则 det ( M ) = 1 \det(M)=1 det ( M ) = 1 。左边变为 ∑ k = 1 n det [ e 1 … A e k … e n ] \sum_{k=1}^n \det[\mathbf{e}_1 \quad \dots \quad A\mathbf{e}_k \quad \dots \quad \mathbf{e}_n] ∑ k = 1 n det [ e 1 … A e k … e n ] 。 A e k A\mathbf{e}_k A e k 是 A A A 的第 k k k 列。所以 det [ e 1 … A e k … e n ] \det[\mathbf{e}_1 \quad \dots \quad A\mathbf{e}_k \quad \dots \quad \mathbf{e}_n] det [ e 1 … A e k … e n ] 等于 A A A 的第 k k k 个对角元素 a k k a_{kk} a kk 。因此左边等于 ∑ k = 1 n a k k = t r ( A ) \sum_{k=1}^n a_{kk} = \mathrm{tr}(A) ∑ k = 1 n a kk = tr ( A ) 。对于一般的可逆矩阵 M M M ,可以通过 M M M 变换到 I I I 来证明。如果 M M M 不可逆,则 det ( M ) = 0 \det(M)=0 det ( M ) = 0 ,且列向量线性相关,通常左边也为0。)
应用此恒等式于我们的情况,令 M = X ( t ) M = \mathbf{X}(t) M = X ( t ) ,则:
d W d t = t r ( A ( t ) ) det ( X ( t ) ) = t r ( A ( t ) ) W ( t ) \frac{\mathrm{d}W}{\mathrm{d}t} = \mathrm{tr}(A(t)) \det(\mathbf{X}(t)) = \mathrm{tr}(A(t)) W(t) d t d W = tr ( A ( t )) det ( X ( t )) = tr ( A ( t )) W ( t ) 这就证明了 Abel 公式。
Abel 公式的推论 :
如果 W ( t 0 ) ≠ 0 W(t_0) \neq 0 W ( t 0 ) = 0 对于某个 t 0 ∈ I t_0 \in I t 0 ∈ I ,那么 W ( t ) ≠ 0 W(t) \neq 0 W ( t ) = 0 对于所有 t ∈ I t \in I t ∈ I (因为指数函数 exp ( ⋅ ) \exp(\cdot) exp ( ⋅ ) 的值恒为正)。
如果 W ( t 0 ) = 0 W(t_0) = 0 W ( t 0 ) = 0 对于某个 t 0 ∈ I t_0 \in I t 0 ∈ I ,那么 W ( t ) = 0 W(t) = 0 W ( t ) = 0 对于所有 t ∈ I t \in I t ∈ I 。
因此,朗斯基行列式或者在区间 I I I 上恒不为零,或者在区间 I I I 上恒为零。
朗斯基行列式与线性无关性 :
齐次线性方程组
d x d t = A ( t ) x \frac{\mathrm{d}\mathbf{x}}{\mathrm{d}t} = A(t)\mathbf{x} d t d x = A ( t ) x 的 n n n 个解 x ( 1 ) ( t ) , … , x ( n ) ( t ) \mathbf{x}^{(1)}(t), \ldots, \mathbf{x}^{(n)}(t) x ( 1 ) ( t ) , … , x ( n ) ( t ) 在区间 I I I 上线性无关的充分必要条件是它们的朗斯基行列式 W ( t ) ≠ 0 W(t) \neq 0 W ( t ) = 0 对于 I I I 中的任意一点 t t t (因此对于 I I I 中的所有点 t t t ) 成立。
证明 :
(⇒ \Rightarrow ⇒ ) 充分性:假设解组 { x ( 1 ) ( t ) , … , x ( n ) ( t ) } \{\mathbf{x}^{(1)}(t), \ldots, \mathbf{x}^{(n)}(t)\} { x ( 1 ) ( t ) , … , x ( n ) ( t )} 在区间 I I I 上线性相关。那么存在不全为零的常数 c 1 , … , c n c_1, \ldots, c_n c 1 , … , c n ,使得对所有 t ∈ I t \in I t ∈ I ,有
∑ j = 1 n c j x ( j ) ( t ) = 0 \sum_{j=1}^n c_j \mathbf{x}^{(j)}(t) = \mathbf{0} j = 1 ∑ n c j x ( j ) ( t ) = 0 这意味着矩阵 X ( t ) = [ x ( 1 ) ( t ) … x ( n ) ( t ) ] \mathbf{X}(t) = [\mathbf{x}^{(1)}(t) \quad \dots \quad \mathbf{x}^{(n)}(t)] X ( t ) = [ x ( 1 ) ( t ) … x ( n ) ( t )] 的列向量对所有 t ∈ I t \in I t ∈ I 都是线性相关的。因此,它们的行列式 W ( t ) = det ( X ( t ) ) = 0 W(t) = \det(\mathbf{X}(t)) = 0 W ( t ) = det ( X ( t )) = 0 对所有 t ∈ I t \in I t ∈ I 成立。
(⇐ \Leftarrow ⇐ ) 必要性:假设 W ( t 0 ) = 0 W(t_0) = 0 W ( t 0 ) = 0 对于区间 I I I 中的某一点 t 0 t_0 t 0 成立。根据 Abel 公式的推论,这意味着 W ( t ) = 0 W(t) = 0 W ( t ) = 0 对所有 t ∈ I t \in I t ∈ I 成立。
在 t = t 0 t=t_0 t = t 0 时,W ( t 0 ) = det ( X ( t 0 ) ) = 0 W(t_0) = \det(\mathbf{X}(t_0)) = 0 W ( t 0 ) = det ( X ( t 0 )) = 0 。这表明矩阵 X ( t 0 ) \mathbf{X}(t_0) X ( t 0 ) 的列向量 x ( 1 ) ( t 0 ) , … , x ( n ) ( t 0 ) \mathbf{x}^{(1)}(t_0), \ldots, \mathbf{x}^{(n)}(t_0) x ( 1 ) ( t 0 ) , … , x ( n ) ( t 0 ) 是线性相关的。因此,存在不全为零的常数 c 1 , … , c n c_1, \ldots, c_n c 1 , … , c n ,使得
∑ j = 1 n c j x ( j ) ( t 0 ) = 0 \sum_{j=1}^n c_j \mathbf{x}^{(j)}(t_0) = \mathbf{0} j = 1 ∑ n c j x ( j ) ( t 0 ) = 0 现在考虑向量函数 y ( t ) = ∑ j = 1 n c j x ( j ) ( t ) \mathbf{y}(t) = \sum_{j=1}^n c_j \mathbf{x}^{(j)}(t) y ( t ) = ∑ j = 1 n c j x ( j ) ( t ) 。由于每个 x ( j ) ( t ) \mathbf{x}^{(j)}(t) x ( j ) ( t ) 都是齐次线性方程组的解,且方程是线性的,所以 y ( t ) \mathbf{y}(t) y ( t ) 也是该方程组的一个解。
并且,y ( t 0 ) = ∑ j = 1 n c j x ( j ) ( t 0 ) = 0 \mathbf{y}(t_0) = \sum_{j=1}^n c_j \mathbf{x}^{(j)}(t_0) = \mathbf{0} y ( t 0 ) = ∑ j = 1 n c j x ( j ) ( t 0 ) = 0 。
我们现在有一个初值问题:
d y d t = A ( t ) y , y ( t 0 ) = 0 \frac{\mathrm{d}\mathbf{y}}{\mathrm{d}t} = A(t)\mathbf{y}, \quad \mathbf{y}(t_0) = \mathbf{0} d t d y = A ( t ) y , y ( t 0 ) = 0 显然,z ( t ) ≡ 0 \mathbf{z}(t) \equiv \mathbf{0} z ( t ) ≡ 0 (零向量函数) 是这个初值问题的一个解。
根据线性系统解的唯一性定理(4.2节的推论),我们必有 y ( t ) ≡ 0 \mathbf{y}(t) \equiv \mathbf{0} y ( t ) ≡ 0 对所有 t ∈ I t \in I t ∈ I 成立。
也就是说,∑ j = 1 n c j x ( j ) ( t ) = 0 \sum_{j=1}^n c_j \mathbf{x}^{(j)}(t) = \mathbf{0} ∑ j = 1 n c j x ( j ) ( t ) = 0 对所有 t ∈ I t \in I t ∈ I 成立,并且常数 c 1 , … , c n c_1, \ldots, c_n c 1 , … , c n 不全为零。
这表明解组 { x ( 1 ) ( t ) , … , x ( n ) ( t ) } \{\mathbf{x}^{(1)}(t), \ldots, \mathbf{x}^{(n)}(t)\} { x ( 1 ) ( t ) , … , x ( n ) ( t )} 在区间 I I I 上是线性相关的。
综上所述,解组线性无关当且仅当 W ( t ) ≠ 0 W(t) \neq 0 W ( t ) = 0 。
4.4 齐次线性微分方程组的通解结构定理# 定理叙述 :
如果齐次线性方程组 d x d t = A ( t ) x \frac{\mathrm{d}\mathbf{x}}{\mathrm{d}t} = A(t)\mathbf{x} d t d x = A ( t ) x 的 n n n 个解 x ( 1 ) ( t ) , … , x ( n ) ( t ) \mathbf{x}^{(1)}(t), \ldots, \mathbf{x}^{(n)}(t) x ( 1 ) ( t ) , … , x ( n ) ( t ) 在区间 I I I 上是线性无关的 (即它们的朗斯基行列式 W ( t ) ≠ 0 W(t) \neq 0 W ( t ) = 0 on I I I ), 那么该齐次线性方程组的通解可以表示为这些解的线性组合:
x h ( t ) = c 1 x ( 1 ) ( t ) + c 2 x ( 2 ) ( t ) + … + c n x ( n ) ( t ) \mathbf{x}_h(t) = c_1 \mathbf{x}^{(1)}(t) + c_2 \mathbf{x}^{(2)}(t) + \ldots + c_n \mathbf{x}^{(n)}(t) x h ( t ) = c 1 x ( 1 ) ( t ) + c 2 x ( 2 ) ( t ) + … + c n x ( n ) ( t ) 其中 c 1 , … , c n c_1, \ldots, c_n c 1 , … , c n 是任意常数。
这样一个线性无关的解组 { x ( 1 ) ( t ) , … , x ( n ) ( t ) } \{\mathbf{x}^{(1)}(t), \ldots, \mathbf{x}^{(n)}(t)\} { x ( 1 ) ( t ) , … , x ( n ) ( t )} 称为方程组的一个 基本解组 (fundamental set of solutions)。
由基本解组构成的矩阵 X ( t ) = [ x ( 1 ) ( t ) … x ( n ) ( t ) ] \mathbf{X}(t) = [\mathbf{x}^{(1)}(t) \quad \dots \quad \mathbf{x}^{(n)}(t)] X ( t ) = [ x ( 1 ) ( t ) … x ( n ) ( t )] 称为一个 基本矩阵 (fundamental matrix)。
证明 :
线性组合是解 :
令 y ( t ) = ∑ j = 1 n c j x ( j ) ( t ) \mathbf{y}(t) = \sum_{j=1}^n c_j \mathbf{x}^{(j)}(t) y ( t ) = ∑ j = 1 n c j x ( j ) ( t ) 。
则
d y d t = ∑ j = 1 n c j d x ( j ) d t = ∑ j = 1 n c j ( A ( t ) x ( j ) ( t ) ) = A ( t ) ( ∑ j = 1 n c j x ( j ) ( t ) ) = A ( t ) y ( t ) \frac{\mathrm{d}\mathbf{y}}{\mathrm{d}t} = \sum_{j=1}^n c_j \frac{\mathrm{d}\mathbf{x}^{(j)}}{\mathrm{d}t} = \sum_{j=1}^n c_j (A(t)\mathbf{x}^{(j)}(t)) = A(t) \left(\sum_{j=1}^n c_j \mathbf{x}^{(j)}(t)\right) = A(t)\mathbf{y}(t) d t d y = j = 1 ∑ n c j d t d x ( j ) = j = 1 ∑ n c j ( A ( t ) x ( j ) ( t )) = A ( t ) ( j = 1 ∑ n c j x ( j ) ( t ) ) = A ( t ) y ( t )
所以,解的任意线性组合也是方程的解。
任何解都可以表示为这种形式 :
设 z ( t ) \mathbf{z}(t) z ( t ) 是方程 d x d t = A ( t ) x \frac{\mathrm{d}\mathbf{x}}{\mathrm{d}t} = A(t)\mathbf{x} d t d x = A ( t ) x 的任意一个解。
在区间 I I I 中取定一点 t 0 t_0 t 0 。我们的目标是找到常数 c 1 , … , c n c_1, \ldots, c_n c 1 , … , c n 使得
c 1 x ( 1 ) ( t 0 ) + c 2 x ( 2 ) ( t 0 ) + … + c n x ( n ) ( t 0 ) = z ( t 0 ) c_1 \mathbf{x}^{(1)}(t_0) + c_2 \mathbf{x}^{(2)}(t_0) + \ldots + c_n \mathbf{x}^{(n)}(t_0) = \mathbf{z}(t_0) c 1 x ( 1 ) ( t 0 ) + c 2 x ( 2 ) ( t 0 ) + … + c n x ( n ) ( t 0 ) = z ( t 0 )
这个方程可以写成矩阵形式: X ( t 0 ) c = z ( t 0 ) \mathbf{X}(t_0) \mathbf{c} = \mathbf{z}(t_0) X ( t 0 ) c = z ( t 0 ) , 其中 c = ( c 1 , … , c n ) T \mathbf{c} = (c_1, \ldots, c_n)^T c = ( c 1 , … , c n ) T 。
由于解组 { x ( 1 ) ( t ) , … , x ( n ) ( t ) } \{\mathbf{x}^{(1)}(t), \ldots, \mathbf{x}^{(n)}(t)\} { x ( 1 ) ( t ) , … , x ( n ) ( t )} 是线性无关的,它们的朗斯基行列式 W ( t 0 ) = det ( X ( t 0 ) ) ≠ 0 W(t_0) = \det(\mathbf{X}(t_0)) \neq 0 W ( t 0 ) = det ( X ( t 0 )) = 0 。
这意味着矩阵 X ( t 0 ) \mathbf{X}(t_0) X ( t 0 ) 是可逆的。因此,存在唯一的常数向量 c \mathbf{c} c 满足上述代数方程组:
c = ( X ( t 0 ) ) − 1 z ( t 0 ) \mathbf{c} = (\mathbf{X}(t_0))^{-1} \mathbf{z}(t_0) c = ( X ( t 0 ) ) − 1 z ( t 0 )
现在,用这些求得的常数 c j c_j c j 构造函数 y ( t ) = ∑ j = 1 n c j x ( j ) ( t ) \mathbf{y}(t) = \sum_{j=1}^n c_j \mathbf{x}^{(j)}(t) y ( t ) = ∑ j = 1 n c j x ( j ) ( t ) 。
根据证明的第一部分,y ( t ) \mathbf{y}(t) y ( t ) 是原齐次线性方程组的一个解。
并且,在 t = t 0 t=t_0 t = t 0 时,y ( t 0 ) = ∑ j = 1 n c j x ( j ) ( t 0 ) = z ( t 0 ) \mathbf{y}(t_0) = \sum_{j=1}^n c_j \mathbf{x}^{(j)}(t_0) = \mathbf{z}(t_0) y ( t 0 ) = ∑ j = 1 n c j x ( j ) ( t 0 ) = z ( t 0 ) 。
因此,y ( t ) \mathbf{y}(t) y ( t ) 和 z ( t ) \mathbf{z}(t) z ( t ) 是同一个初值问题 d x d t = A ( t ) x \frac{\mathrm{d}\mathbf{x}}{\mathrm{d}t} = A(t)\mathbf{x} d t d x = A ( t ) x , x ( t 0 ) = z ( t 0 ) \mathbf{x}(t_0) = \mathbf{z}(t_0) x ( t 0 ) = z ( t 0 ) 的解。
根据解的存在唯一性定理(4.2节的推论),我们必须有 y ( t ) = z ( t ) \mathbf{y}(t) = \mathbf{z}(t) y ( t ) = z ( t ) 对所有 t ∈ I t \in I t ∈ I 成立。
所以,齐次线性方程组的任意解 z ( t ) \mathbf{z}(t) z ( t ) 都可以表示为基本解组的线性组合 ∑ j = 1 n c j x ( j ) ( t ) \sum_{j=1}^n c_j \mathbf{x}^{(j)}(t) ∑ j = 1 n c j x ( j ) ( t ) 的形式。
4.5 非齐次线性微分方程组的通解结构# 考虑非齐次线性方程组 (NHL):
d x d t = A ( t ) x + f ( t ) \frac{\mathrm{d}\mathbf{x}}{\mathrm{d}t} = A(t)\mathbf{x} + \mathbf{f}(t) d t d x = A ( t ) x + f ( t ) 以及对应的齐次线性方程组 (HL):
d x d t = A ( t ) x \frac{\mathrm{d}\mathbf{x}}{\mathrm{d}t} = A(t)\mathbf{x} d t d x = A ( t ) x 定理叙述 :
非齐次线性方程组 (NHL) 的通解 x ( t ) \mathbf{x}(t) x ( t ) 可以表示为:
x ( t ) = x h ( t ) + x p ( t ) \mathbf{x}(t) = \mathbf{x}_h(t) + \mathbf{x}_p(t) x ( t ) = x h ( t ) + x p ( t ) 其中 x h ( t ) \mathbf{x}_h(t) x h ( t ) 是对应的齐次方程组 (HL) 的通解,x p ( t ) \mathbf{x}_p(t) x p ( t ) 是非齐次方程组 (NHL) 的任意一个特解。
证明 :
证明 x h ( t ) + x p ( t ) \mathbf{x}_h(t) + \mathbf{x}_p(t) x h ( t ) + x p ( t ) 是 (NHL) 的解 :
设 x h ( t ) \mathbf{x}_h(t) x h ( t ) 是 (HL) 的通解,即 d x h d t = A ( t ) x h ( t ) \frac{\mathrm{d}\mathbf{x}_h}{\mathrm{d}t} = A(t)\mathbf{x}_h(t) d t d x h = A ( t ) x h ( t ) 。
设 x p ( t ) \mathbf{x}_p(t) x p ( t ) 是 (NHL) 的一个特解,即 d x p d t = A ( t ) x p ( t ) + f ( t ) \frac{\mathrm{d}\mathbf{x}_p}{\mathrm{d}t} = A(t)\mathbf{x}_p(t) + \mathbf{f}(t) d t d x p = A ( t ) x p ( t ) + f ( t ) 。
令 y ( t ) = x h ( t ) + x p ( t ) \mathbf{y}(t) = \mathbf{x}_h(t) + \mathbf{x}_p(t) y ( t ) = x h ( t ) + x p ( t ) 。
则
d y d t = d x h d t + d x p d t \frac{\mathrm{d}\mathbf{y}}{\mathrm{d}t} = \frac{\mathrm{d}\mathbf{x}_h}{\mathrm{d}t} + \frac{\mathrm{d}\mathbf{x}_p}{\mathrm{d}t} d t d y = d t d x h + d t d x p
= A ( t ) x h ( t ) + ( A ( t ) x p ( t ) + f ( t ) ) = A(t)\mathbf{x}_h(t) + (A(t)\mathbf{x}_p(t) + \mathbf{f}(t)) = A ( t ) x h ( t ) + ( A ( t ) x p ( t ) + f ( t ))
= A ( t ) ( x h ( t ) + x p ( t ) ) + f ( t ) = A(t)(\mathbf{x}_h(t) + \mathbf{x}_p(t)) + \mathbf{f}(t) = A ( t ) ( x h ( t ) + x p ( t )) + f ( t )
= A ( t ) y ( t ) + f ( t ) = A(t)\mathbf{y}(t) + \mathbf{f}(t) = A ( t ) y ( t ) + f ( t )
所以 y ( t ) \mathbf{y}(t) y ( t ) 是 (NHL) 的解。由于 x h ( t ) \mathbf{x}_h(t) x h ( t ) 包含 n n n 个任意常数(来自齐次通解),y ( t ) \mathbf{y}(t) y ( t ) 是 (NHL) 的通解。
证明 (NHL) 的任意解都可以写成这种形式 :
设 z ( t ) \mathbf{z}(t) z ( t ) 是 (NHL) 的任意一个解,x p ( t ) \mathbf{x}_p(t) x p ( t ) 是 (NHL) 的某一个(已知的)特解。
即 d z d t = A ( t ) z ( t ) + f ( t ) \frac{\mathrm{d}\mathbf{z}}{\mathrm{d}t} = A(t)\mathbf{z}(t) + \mathbf{f}(t) d t d z = A ( t ) z ( t ) + f ( t ) 和 d x p d t = A ( t ) x p ( t ) + f ( t ) \frac{\mathrm{d}\mathbf{x}_p}{\mathrm{d}t} = A(t)\mathbf{x}_p(t) + \mathbf{f}(t) d t d x p = A ( t ) x p ( t ) + f ( t ) 。
考虑函数 w ( t ) = z ( t ) − x p ( t ) \mathbf{w}(t) = \mathbf{z}(t) - \mathbf{x}_p(t) w ( t ) = z ( t ) − x p ( t ) 。
d w d t = d z d t − d x p d t \frac{\mathrm{d}\mathbf{w}}{\mathrm{d}t} = \frac{\mathrm{d}\mathbf{z}}{\mathrm{d}t} - \frac{\mathrm{d}\mathbf{x}_p}{\mathrm{d}t} d t d w = d t d z − d t d x p
= ( A ( t ) z ( t ) + f ( t ) ) − ( A ( t ) x p ( t ) + f ( t ) ) = (A(t)\mathbf{z}(t) + \mathbf{f}(t)) - (A(t)\mathbf{x}_p(t) + \mathbf{f}(t)) = ( A ( t ) z ( t ) + f ( t )) − ( A ( t ) x p ( t ) + f ( t ))
= A ( t ) z ( t ) − A ( t ) x p ( t ) = A(t)\mathbf{z}(t) - A(t)\mathbf{x}_p(t) = A ( t ) z ( t ) − A ( t ) x p ( t )
= A ( t ) ( z ( t ) − x p ( t ) ) = A(t)(\mathbf{z}(t) - \mathbf{x}_p(t)) = A ( t ) ( z ( t ) − x p ( t ))
= A ( t ) w ( t ) = A(t)\mathbf{w}(t) = A ( t ) w ( t )
这表明 w ( t ) \mathbf{w}(t) w ( t ) 是对应的齐次方程组 (HL) 的一个解。
因此,w ( t ) \mathbf{w}(t) w ( t ) 必可表示为 (HL) 的通解形式。也就是说,w ( t ) \mathbf{w}(t) w ( t ) 是 x h ( t ) \mathbf{x}_h(t) x h ( t ) ((HL) 的通解)中的一个特定解。
所以 z ( t ) − x p ( t ) = x h ( t ) \mathbf{z}(t) - \mathbf{x}_p(t) = \mathbf{x}_h(t) z ( t ) − x p ( t ) = x h ( t ) (这里 x h ( t ) \mathbf{x}_h(t) x h ( t ) 代表一个特定的齐次解)。
从而 z ( t ) = x h ( t ) + x p ( t ) \mathbf{z}(t) = \mathbf{x}_h(t) + \mathbf{x}_p(t) z ( t ) = x h ( t ) + x p ( t ) (这里 x h ( t ) \mathbf{x}_h(t) x h ( t ) 可以被理解为齐次通解,因为 z ( t ) \mathbf{z}(t) z ( t ) 是任意的非齐次解)。
这就证明了 (NHL) 的任意解都可以表示为齐次通解与一个非齐次特解之和。
关于常系数 :
上述理论(存在唯一性,朗斯基行列式,通解结构)对变系数 A ( t ) A(t) A ( t ) 均成立。当 A ( t ) ≡ A A(t) \equiv A A ( t ) ≡ A (常数矩阵)时,称为常系数线性微分方程组:
A ( t ) A(t) A ( t ) 和 f ( t ) \mathbf{f}(t) f ( t ) 的连续性条件简化为 f ( t ) \mathbf{f}(t) f ( t ) 的连续性(因为常数矩阵 A A A 总是连续的)。
Abel 公式中的 t r ( A ( t ) ) \mathrm{tr}(A(t)) tr ( A ( t )) 变为常数 t r ( A ) \mathrm{tr}(A) tr ( A ) ,所以 W ( t ) = W ( t 0 ) e t r ( A ) ( t − t 0 ) W(t) = W(t_0) e^{\mathrm{tr}(A)(t-t_0)} W ( t ) = W ( t 0 ) e tr ( A ) ( t − t 0 ) 。
寻找基本解组 x ( j ) ( t ) \mathbf{x}^{(j)}(t) x ( j ) ( t ) 的方法有特定的技巧,例如利用特征值和特征向量(当 A A A 可对角化时)或广义特征向量。例如,若 λ \lambda λ 是常数矩阵 A A A 的特征值,v \mathbf{v} v 是对应的特征向量,则 x ( t ) = e λ t v \mathbf{x}(t) = e^{\lambda t}\mathbf{v} x ( t ) = e λ t v 是齐次方程组的一个解。
这些是关于一阶微分方程组和线性一阶微分方程组(特别是常系数情况)解的一般理论的核心内容。