设矩阵AAA的第iii大特征值为λi\lambda_iλi, 对应特征向量viv_ivi,A=AHA=A^HA=AH 求:
∇Aλi=∂λi∂A∗\nabla_A\lambda_i=\frac{\partial \lambda_i}{\partial A^*}∇Aλi=∂A∗∂λi
目标: 写出 dλi=tr(BdAH)d\lambda_i=tr(BdA^H)dλi=tr(BdAH)
则有∇Aλi=B\nabla_A\lambda_i=B∇Aλi=B。
根据特征值定义: Avi=λivi,viHvi=1Av_i=\lambda_iv_i, v_i^Hv_i=1Avi=λivi,viHvi=1
有:
d(Av1)=dA∗v1+Advi=d(λivi)=dλi∗vi+λi(dvi)(1)d(Av_1)=dA * v_1 + Adv_i =d(\lambda_iv_i)=d\lambda_i *v_i +\lambda_i (dv_i)\tag{1}d(Av1)=dA∗v1+Advi=d(λivi)=dλi∗vi+λi(dvi)(1)
以及:
d(viHvi)=d(1)=0=2viHdvi⇒viHdvi=0d(v_i^Hv_i)=d(1)=0=2v_i^Hdv_i\Rightarrow v_i^Hdv_i =0 d(viHvi)=d(1)=0=2viHdvi⇒viHdvi=0
将式(1)左右左乘viHv_i^HviH, 得到:
viH(dA)vi+viHAdvi=viH(dλi)vi+viHλi(dvi)v_i^H(dA)v_i +v_i^HAdv_i=v_i^H(d\lambda_i)v_i+v_i^H\lambda_i(dv_i)viH(dA)vi+viHAdvi=viH(dλi)vi+viHλi(dvi)
而 viHA=λiviv_i^HA=\lambda_iv_iviHA=λivi, 因此 viHAdvi=0v_i^HAdv_i=0viHAdvi=0。 类似的, viHλi(dvi)=0v_i^H\lambda_i(dv_i)=0viHλi(dvi)=0。
因此:
viH(dA)vi=viH(dλi)vi=viHvidλi=dλiv_i^H(dA)v_i=v_i^H(d\lambda_i)v_i=v_i^Hv_id\lambda_i=d\lambda_iviH(dA)vi=viH(dλi)vi=viHvidλi=dλi
因此 (dA=dAH)(dA = dA^H)(dA=dAH)
dλi=tr(viviHdAH)d\lambda_i = tr(v_iv_i^HdA^H)dλi=tr(viviHdAH)
∇Aλi=B=viviH\nabla_A\lambda_i=B = v_iv_i^H∇Aλi=B=viviH