檢視 LQG控制的原始碼

'''LQG 控制'''（linear–quadratic–Gaussian control）全名是'''線性二改高斯控制'''，是控制理論中的基礎最佳控制問題之一。此問題佮存在高斯白噪音的線性系統有關係。此問題是愛揣著最佳的輸出回授律，會當予二改費用函式的期值上小化。其輸出量測假設受著高斯噪聲的影響，其初值嘛是高斯隨機向量。

佇咧「使用線性控制律」的最佳控制假使若是，會用得 completion-of-squares 論述進行推導。此控制律就開始來'''LQG 控制器'''，就是卡爾曼濾波（線性二次狀態估測器，LQE）和 LQR 控制器的結合。分離原理指出狀態估測器佮狀態回授會用獨立設計。LQG 控制會當應用佇線性的時陣無變系統佮線性的時陣變系統，產生容易計算以及實現的線性動態回授控制器。LQG 控制器本身是一个類似其受控系統的動態系統，兩个人有仝款的維度。

根據分離原理，佇咧一寡範圍較闊可能是非線性的控制器內底，LQG 控制器猶原是上好的。也就是講「使用非線性控制架構無一定會當改善費用函的期望值」。 這个版本的分離原理是隨機控制的分離原理（separation principle of stochastic control）講著就算過程佮輸出雜訊源可能是非高斯七，只要其系統動態是線性的，其實上好控制猶會當分離做最佳狀態估測器（不再是卡爾曼濾波器）佮 LQR 控制器。LQR 控制器嘛有用來控制擾動的非線性系統。

==問題佮解的數學描述==

===連紲時間===

考慮連紲時間的線性動態系統


: $ { \ dot { \ mathbf { x } } } ( t )=A ( t ) \ mathbf { x } ( t ) + B ( t ) \ mathbf { u } ( t ) + \ mathbf { v } ( t ) , $


: $ \ mathbf { y } ( t )=C ( t ) \ mathbf { x } ( t ) + \ mathbf { w } ( t ) , $

其中 $ { \ mathbf { x } } $ 是系統狀態變數的向量，$ { \ mathbf { u } } $ 是控制輸入向量，$ { \ mathbf { y } } $ 是輸出量測值的向量，可用佇回授的頂懸。系統受著加成性的高斯系統雜訊 $ \ mathbf { v } ( t ) $ 佮加成性的高斯量測雜訊 $ \ mathbf { w } ( t ) $ 所的影響。予定一系統，其目標是揣著一控制輸入 $ { \ mathbf { u } } ( t ) $，此控制輸入佇每一个時間 $ { \ mathbf { } } t $ 落，佮往過的量測量 $ { \ mathbf { y } } ( t') , 零 \ leq t'< t $ 有線性關係，啊而且這控制輸入會當予以下的費用函式有上細漢值：


: $ J=\ mathbb { E } \ left [{ \ mathbf { x } ^ { \ mathrm { T } } } ( T ) F { \ mathbf { x } } ( T ) + \ int _ { 零 } ^ { T } { \ mathbf { x } ^ { \ mathrm { T } } } ( t ) Q ( t ) { \ mathbf { x } } ( t ) + { \ mathbf { u } ^ { \ mathrm { T } } } ( t ) R ( t ) { \ mathbf { u } } ( t ) \ , dt \ right] , $


: $ F \ geq 零 , \ quad Q ( t ) \ geq 零 , \ quad R ( t ) > 零 , $

其中 $ \ mathbb { E } $ 為期望值。終其尾的時間（horizon）$ { \ mathbf { } } T $ 可能是有限值抑是無限值。如果最終時間為無限，則費用函式的第一項 $ { \ mathbf { x } } ^ { \ mathrm { T } } ( T ) F { \ mathbf { x } } ( T ) $ 會使失覺察，和問題沒關係。為著欲予費用函式為有限值，會定義費用函式做 $ { \ mathbf { } } J / T $。

求解述 LQG 問題的 LQG 控制器會當用下跤程表示：


: $ { \ dot { \ hat { \ mathbf { x } } } } ( t )=A ( t ) { \ hat { \ mathbf { x } } } ( t ) + B ( t ) { \ mathbf { u } } ( t ) + L ( t ) \ left ( { \ mathbf { y } } ( t )-C ( t ) { \ hat { \ mathbf { x } } } ( t ) \ right ) , \ quad { \ hat { \ mathbf { x } } } ( 零 )=\ mathbb { E } \ left [{ \ mathbf { x } } ( 零 ) \ right] , $


: $ { \ mathbf { u } } ( t )=-K ( t ) { \ hat { \ mathbf { x } } } ( t ) . $

矩陣 $ { \ mathbf { } } L ( t ) $ 講號做卡爾曼增益（Kalman gain）， 佮第一个方程卡爾曼濾波有關係。佇時間 $ { \ mathbf { } } t $，濾波器會根據過去量測佮輸入來產生狀態 $ { \ mathbf { x } } ( t ) $ 的估測值 $ { \ hat { \ mathbf { x } } } ( t ) $。卡爾曼增益 $ { \ mathbf { } } L ( t ) $ 是根據 $ { \ mathbf { } } A ( t ) , C ( t ) $、二个佮白色高斯雜訊有關密度矩陣 $ \ mathbf { v } ( t ) $、$ \ mathbf { w } ( t ) $ 猶閣有最後的 $ \ mathbb { E } \ left [{ \ mathbf { x } } ( 零 ) { \ mathbf { x } } ^ { \ mathrm { T } } ( 零 ) \ right] $ 來計算。這五个矩陣會透過以下的矩陣 Riccati 微分方程來決定卡爾曼增益：


: $ { \ dot { P } } ( t )=A ( t ) P ( t ) + P ( t ) A ^ { \ mathrm { T } } ( t )-P ( t ) C ^ { \ mathrm { T } } ( t ) { \ mathbf { } } W ^ { 影一 } ( t ) C ( t ) P ( t ) + V ( t ) , $


: $ P ( 零 )=\ mathbb { E } \ left [{ \ mathbf { x } } ( 零 ) { \ mathbf { x } } ^ { \ mathrm { T } } ( 零 ) \ right] . $

假使其解 $ P ( t ) , 零 \ leq t \ leq T $，是卡爾曼增益等於


: $ { \ mathbf { } } L ( t )=P ( t ) C ^ { \ mathrm { T } } ( t ) W ^ { 影一 } ( t ) . $

矩陣 $ { \ mathbf { } } K ( t ) $ 回授增益（feedback gain）矩陣，是由 $ { \ mathbf { } } A ( t ) , B ( t ) , Q ( t ) , R ( t ) $ 佮 $ { \ mathbf { } } F $ 矩陣，透過以下的矩陣 Riccati 微分方程來決定


: $-{ \ dot { S } } ( t )=A ^ { \ mathrm { T } } ( t ) S ( t ) + S ( t ) A ( t )-S ( t ) B ( t ) R ^ { 影一 } ( t ) B ^ { \ mathrm { T } } ( t ) S ( t ) + Q ( t ) , $


: $ { \ mathbf { } } S ( T )=F . $

假使其解 $ { \ mathbf { } } S ( t ) , 零 \ leq t \ leq T $，回授增益等於


: $ { \ mathbf { } } K ( t )=R ^ { 影一 } ( t ) B ^ { \ mathrm { T } } ( t ) S ( t ) . $

觀察咧講二个矩陣 Riccati 微分方逝，第一个沿時間進前後壁算，第二个是沿時間從後改算，這號做「嘿尪仔性」。 頭一个矩陣 Riccati 微分方程解了線性平方估測問題（LQE）， 第二个矩陣 Riccati 微分方程解了 LQR 控制器問題。這兩个問題嘿尪仔，合起來就解了線性平方高斯控制問題（LQG )，所以 LQG 問題分做 LQE 問題以及 LQR 問題，而且會使獨立求解，所以 LQG 問題是「會當分離的」。

當 $ { \ mathbf { } } A ( t ) , B ( t ) , C ( t ) , Q ( t ) , R ( t ) $ 佮雜訊密度矩陣 $ \ mathbf { } V ( t ) $ , $ \ mathbf { } W ( t ) $ 袂隨時間咧變化 $ { \ mathbf { } } t $，而且 $ { \ mathbf { } } T $ 較無限大時間，LQG 控制器會變做非時變動態系統。現此時欲出二个矩陣 Riccati 微分方程會變做代數 Riccati 四角勢。

===離散的時間===

離散時間的 LQG 控制問題佮連紲時間下的問題相倚，所以下跤干焦關注其數學式。

離散時間的線性系統方程為


: $ { \ mathbf { x } } _ { i + 一 }=A _ { i } \ mathbf { x } _ { i } + B _ { i } \ mathbf { u } _ { i } + \ mathbf { v } _ { i } , $


: $ \ mathbf { y } _ { i }=C _ { i } \ mathbf { x } _ { i } + \ mathbf { w } _ { i } . $

其中 $ \ mathbf { } i $ 是離散時間，$ \ mathbf { v } _ { i } , \ mathbf { w } _ { i } $ 是離散時間高斯白雜訊的過程，其共變做異數矩陣為 $ \ mathbf { } V _ { i } , W _ { i } $。

欲上小化的二次費用函式做


: $ J=\ mathbb { E } \ left [{ \ mathbf { x } } _ { N } ^ { \ mathrm { T } } F { \ mathbf { x } } _ { N } + \ sum _ { i=零 } ^ { N 影一 } ( \ mathbf { x } _ { i } ^ { \ mathrm { T } } Q _ { i } \ mathbf { x } _ { i } + \ mathbf { u } _ { i } ^ { \ mathrm { T } } R _ { i } \ mathbf { u } _ { i } ) \ right] , $


: $ F \ geq 零 , Q _ { i } \ geq 零 , R _ { i } > 零 . \ , $

離散時間的 LQG 控制器為


: $ { \ hat { \ mathbf { x } } } _ { i + 一 }=A _ { i } { \ hat { \ mathbf { x } } } _ { i } + B _ { i } { \ mathbf { u } } _ { i } + L _ { i + 一 } \ left ( { \ mathbf { y } } _ { i + 一 }-C _ { i + 一 } \ left \ { A _ { i } { \ hat { \ mathbf { x } } } _ { i } + B _ { i } u _ { i } \ right \ } \ right ) , { \ hat { \ mathbf { x } } } _ { 零 }=\ mathbb { E } [{ \ mathbf { x } } _ { 零 }] $ ,


: $ \ mathbf { u } _ { i }=-K _ { i } { \ hat { \ mathbf { x } } } _ { i } . \ , $

卡爾曼增益等於


: $ { \ mathbf { } } L _ { i }=P _ { i } C _ { i } ^ { \ mathrm { T } } ( C _ { i } P _ { i } C _ { i } ^ { \ mathrm { T } } + W _ { i } ) ^ { 影一 } , $

其中 $ { \ mathbf { } } P _ { i } $ 是以下依時間向頭前進的矩陣 Riccati 差分方程所決定：


: $ P _ { i + 一 }=A _ { i } \ left ( P _ { i }-P _ { i } C _ { i } ^ { \ mathrm { T } } \ left ( C _ { i } P _ { i } C _ { i } ^ { \ mathrm { T } } + W _ { i } \ right ) ^ { 影一 } C _ { i } P _ { i } \ right ) A _ { i } ^ { \ mathrm { T } } + V _ { i } , P _ { 零 }=\ mathbb { E } \ left ( { \ mathbf { x } } _ { 零 }-{ \ hat { \ mathbf { x } } } _ { 零 } \ right ) \ left ( { \ mathbf { x } } _ { 零 }-{ \ hat { \ mathbf { x } } } _ { 零 } \ right ) ^ { \ mathrm { T } } . $

回授增益矩陣為


: $ { \ mathbf { } } K _ { i }=( B _ { i } ^ { \ mathrm { T } } S _ { i + 一 } B _ { i } + R _ { i } ) ^ { 影一 } B _ { i } ^ { \ mathrm { T } } S _ { i + 一 } A _ { i } $

\
其中 $ { \ mathbf { } } S _ { i } $ 是以下的時間從後進前算的矩陣 Riccati 差分方程所決定：


: $ S _ { i }=A _ { i } ^ { \ mathrm { T } } \ left ( S _ { i + 一 }-S _ { i + 一 } B _ { i } \ left ( B _ { i } ^ { \ mathrm { T } } S _ { i + 一 } B _ { i } + R _ { i } \ right )^ { 影一 } B _ { i } ^ { \ mathrm { T } } S _ { i + 一 } \ right ) A _ { i } + Q _ { i } , \ quad S _ { N }=F . $

若問題中所有的矩陣攏是非時變的，而且時間長度 $ { \ mathbf { } } N $ 趨勢強欲無窮大，是離散時間的 LQG 控制台就是非時變的。現此時矩陣 Riccati 差分方程會當用離散的時間的代數 Riccati 風程取代。會當決定非時變的離散線性兩擺估測器，猶閣有非時變的離散 LQR 控制器。為著欲予費用是有限值，會曉用 $ { \ mathbf { } } J / N $ 來代替 $ { \ mathbf { } } J $。

==降級 LQG 問題==

佇傳統 LQG 設定中，當系統維度真大的時陣，實現 LQG 控制器會有困難。'''降級 LQG 問題'''（reduced-order LQG problem）嘛叫做'''固定階數 LQG 問題'''（fixed-order LQG problem）先設定矣啦 LQG 控制的狀態數。因為分離原理已經無適用，這个問題會閣較無簡單求解，而且其解嘛無唯一。就算按呢，降級 LQG 問題已經有袂少的數值演算法會當求解相關的最佳投影方程（optimal projection equations）， 其中建構矣局部上好化的降階 LQG 問題的充份佮必要條件。

==LQG 控制的勇健性==

LQG 最佳化本身無確保有良好的強健性，需要咧設計予好 LQG 控制了後，另外確認閉迴路系統的勇健穩定性。為著提昇系統的勇健性，可能會共一寡系統參數由確定值改假設是隨機值。相關的控制問題會閣較複雜，會得著一个類似的最佳控制器，干焦控制器參數無仝。

==相關條目==

* 隨機控制
* Witsenhausen 反例

==參考資料==

==延伸閱讀==

* Stengel , Robert F . Optimal Control and Estimation . New York : Dover . 一千九百九十四 . ISBN  空抹四百八十六鋪六七八千二百鋪五 .

[[分類: 待校正]]