矩阵求导结果的布局
functon \input |
标量变元 |
向量变元 |
矩阵变元 |
实值标量函数 |
|
|
|
实向量函数 |
|
|
|
实矩阵函数 |
|
|
|
一般向量默认为列向量
矩阵求导即每个 对变元中的每个元素逐个求偏导。其中有两种形式
- Jacobian 阵形式:对 求偏导
- 梯度向量形式:对 求导
求导后结果的布局一般即一下两种情况:
- 分子布局,就是分子是列向量形式,分母是行向量形式
- 分母布局,就是分母是列向量形式,分子是行向量形式
向量变元,标量函数
两种形式互为转置
矩阵变元,标量函数
:按列堆栈来向量化
矩阵变元,矩阵函数
设
矩阵求导公式
矩阵微分
基本形式
可以看出 ,因此如果能全微分成 ,则可直接求出导数。
且该结果已证明唯一。即若 ,则
当矩阵“退化”为向量时仍成立
微分基本公式
- 对于 ,
- 夹层饼
因此,行列式对元素 的偏导,即为该元素对应的代数余子式,行列式对矩阵求导结果即伴随矩阵。由于伴随矩阵与逆矩阵满足
带入得
证明思路即 两边同时微分得到
常用例
均可对应[[#矩阵求导公式]]
对于实值标量函数求导:
如果是迹形式的实值标量函数同理:
如果是矢量或矩阵函数,则需对每个函数元素微分求导
【例 1】
【例 2】
【例 3】
其中 为方阵
【例 4】
其中 为方阵
【例 5】
其中 均为方阵, 为常数阵
【例 6】
其中 为方阵
参考
© 2024 LiQ
:) 由 Obsidian&Github 强力驱动