跳至內容

LQG控制

出自Taiwan Tongues 台語維基
這是此頁批准,以及是最近的修訂。

LQG 控制(linear–quadratic–Gaussian control)全名是線性二改高斯控制,是控制理論中的基礎最佳控制問題之一。此問題佮存在高斯白噪音的線性系統有關係。此問題是愛揣著最佳的輸出回授律,會當予二改費用函式的期值上小化。其輸出量測假設受著高斯噪聲的影響,其初值嘛是高斯隨機向量。

佇咧「使用線性控制律」的最佳控制假使若是,會用得 completion-of-squares 論述進行推導。此控制律就開始來LQG 控制器,就是卡爾曼濾波(線性二次狀態估測器,LQE)和 LQR 控制器的結合。分離原理指出狀態估測器佮狀態回授會用獨立設計。LQG 控制會當應用佇線性的時陣無變系統佮線性的時陣變系統,產生容易計算以及實現的線性動態回授控制器。LQG 控制器本身是一个類似其受控系統的動態系統,兩个人有仝款的維度。

根據分離原理,佇咧一寡範圍較闊可能是非線性的控制器內底,LQG 控制器猶原是上好的。也就是講「使用非線性控制架構無一定會當改善費用函的期望值」。 這个版本的分離原理是隨機控制的分離原理(separation principle of stochastic control)講著就算過程佮輸出雜訊源可能是非高斯七,只要其系統動態是線性的,其實上好控制猶會當分離做最佳狀態估測器(不再是卡爾曼濾波器)佮 LQR 控制器。LQR 控制器嘛有用來控制擾動的非線性系統。

問題佮解的數學描述

連紲時間

考慮連紲時間的線性動態系統


$ { \ dot { \ mathbf { x } } } ( t )=A ( t ) \ mathbf { x } ( t ) + B ( t ) \ mathbf { u } ( t ) + \ mathbf { v } ( t ) , $


$ \ mathbf { y } ( t )=C ( t ) \ mathbf { x } ( t ) + \ mathbf { w } ( t ) , $

其中 $ { \ mathbf { x } } $ 是系統狀態變數的向量,$ { \ mathbf { u } } $ 是控制輸入向量,$ { \ mathbf { y } } $ 是輸出量測值的向量,可用佇回授的頂懸。系統受著加成性的高斯系統雜訊 $ \ mathbf { v } ( t ) $ 佮加成性的高斯量測雜訊 $ \ mathbf { w } ( t ) $ 所的影響。予定一系統,其目標是揣著一控制輸入 $ { \ mathbf { u } } ( t ) $,此控制輸入佇每一个時間 $ { \ mathbf { } } t $ 落,佮往過的量測量 $ { \ mathbf { y } } ( t') , 零 \ leq t'< t $ 有線性關係,啊而且這控制輸入會當予以下的費用函式有上細漢值:


$ J=\ mathbb { E } \ left [{ \ mathbf { x } ^ { \ mathrm { T } } } ( T ) F { \ mathbf { x } } ( T ) + \ int _ { 零 } ^ { T } { \ mathbf { x } ^ { \ mathrm { T } } } ( t ) Q ( t ) { \ mathbf { x } } ( t ) + { \ mathbf { u } ^ { \ mathrm { T } } } ( t ) R ( t ) { \ mathbf { u } } ( t ) \ , dt \ right] , $


$ F \ geq 零 , \ quad Q ( t ) \ geq 零 , \ quad R ( t ) > 零 , $

其中 $ \ mathbb { E } $ 為期望值。終其尾的時間(horizon)$ { \ mathbf { } } T $ 可能是有限值抑是無限值。如果最終時間為無限,則費用函式的第一項 $ { \ mathbf { x } } ^ { \ mathrm { T } } ( T ) F { \ mathbf { x } } ( T ) $ 會使失覺察,和問題沒關係。為著欲予費用函式為有限值,會定義費用函式做 $ { \ mathbf { } } J / T $。

求解述 LQG 問題的 LQG 控制器會當用下跤程表示:


$ { \ dot { \ hat { \ mathbf { x } } } } ( t )=A ( t ) { \ hat { \ mathbf { x } } } ( t ) + B ( t ) { \ mathbf { u } } ( t ) + L ( t ) \ left ( { \ mathbf { y } } ( t )-C ( t ) { \ hat { \ mathbf { x } } } ( t ) \ right ) , \ quad { \ hat { \ mathbf { x } } } ( 零 )=\ mathbb { E } \ left [{ \ mathbf { x } } ( 零 ) \ right] , $


$ { \ mathbf { u } } ( t )=-K ( t ) { \ hat { \ mathbf { x } } } ( t ) . $

矩陣 $ { \ mathbf { } } L ( t ) $ 講號做卡爾曼增益(Kalman gain), 佮第一个方程卡爾曼濾波有關係。佇時間 $ { \ mathbf { } } t $,濾波器會根據過去量測佮輸入來產生狀態 $ { \ mathbf { x } } ( t ) $ 的估測值 $ { \ hat { \ mathbf { x } } } ( t ) $。卡爾曼增益 $ { \ mathbf { } } L ( t ) $ 是根據 $ { \ mathbf { } } A ( t ) , C ( t ) $、二个佮白色高斯雜訊有關密度矩陣 $ \ mathbf { v } ( t ) $、$ \ mathbf { w } ( t ) $ 猶閣有最後的 $ \ mathbb { E } \ left [{ \ mathbf { x } } ( 零 ) { \ mathbf { x } } ^ { \ mathrm { T } } ( 零 ) \ right] $ 來計算。這五个矩陣會透過以下的矩陣 Riccati 微分方程來決定卡爾曼增益:


$ { \ dot { P } } ( t )=A ( t ) P ( t ) + P ( t ) A ^ { \ mathrm { T } } ( t )-P ( t ) C ^ { \ mathrm { T } } ( t ) { \ mathbf { } } W ^ { 影一 } ( t ) C ( t ) P ( t ) + V ( t ) , $


$ P ( 零 )=\ mathbb { E } \ left [{ \ mathbf { x } } ( 零 ) { \ mathbf { x } } ^ { \ mathrm { T } } ( 零 ) \ right] . $

假使其解 $ P ( t ) , 零 \ leq t \ leq T $,是卡爾曼增益等於


$ { \ mathbf { } } L ( t )=P ( t ) C ^ { \ mathrm { T } } ( t ) W ^ { 影一 } ( t ) . $

矩陣 $ { \ mathbf { } } K ( t ) $ 回授增益(feedback gain)矩陣,是由 $ { \ mathbf { } } A ( t ) , B ( t ) , Q ( t ) , R ( t ) $ 佮 $ { \ mathbf { } } F $ 矩陣,透過以下的矩陣 Riccati 微分方程來決定


$-{ \ dot { S } } ( t )=A ^ { \ mathrm { T } } ( t ) S ( t ) + S ( t ) A ( t )-S ( t ) B ( t ) R ^ { 影一 } ( t ) B ^ { \ mathrm { T } } ( t ) S ( t ) + Q ( t ) , $


$ { \ mathbf { } } S ( T )=F . $

假使其解 $ { \ mathbf { } } S ( t ) , 零 \ leq t \ leq T $,回授增益等於


$ { \ mathbf { } } K ( t )=R ^ { 影一 } ( t ) B ^ { \ mathrm { T } } ( t ) S ( t ) . $

觀察咧講二个矩陣 Riccati 微分方逝,第一个沿時間進前後壁算,第二个是沿時間從後改算,這號做「嘿尪仔性」。 頭一个矩陣 Riccati 微分方程解了線性平方估測問題(LQE), 第二个矩陣 Riccati 微分方程解了 LQR 控制器問題。這兩个問題嘿尪仔,合起來就解了線性平方高斯控制問題(LQG ),所以 LQG 問題分做 LQE 問題以及 LQR 問題,而且會使獨立求解,所以 LQG 問題是「會當分離的」。

當 $ { \ mathbf { } } A ( t ) , B ( t ) , C ( t ) , Q ( t ) , R ( t ) $ 佮雜訊密度矩陣 $ \ mathbf { } V ( t ) $ , $ \ mathbf { } W ( t ) $ 袂隨時間咧變化 $ { \ mathbf { } } t $,而且 $ { \ mathbf { } } T $ 較無限大時間,LQG 控制器會變做非時變動態系統。現此時欲出二个矩陣 Riccati 微分方程會變做代數 Riccati 四角勢。

離散的時間

離散時間的 LQG 控制問題佮連紲時間下的問題相倚,所以下跤干焦關注其數學式。

離散時間的線性系統方程為


$ { \ mathbf { x } } _ { i + 一 }=A _ { i } \ mathbf { x } _ { i } + B _ { i } \ mathbf { u } _ { i } + \ mathbf { v } _ { i } , $


$ \ mathbf { y } _ { i }=C _ { i } \ mathbf { x } _ { i } + \ mathbf { w } _ { i } . $

其中 $ \ mathbf { } i $ 是離散時間,$ \ mathbf { v } _ { i } , \ mathbf { w } _ { i } $ 是離散時間高斯白雜訊的過程,其共變做異數矩陣為 $ \ mathbf { } V _ { i } , W _ { i } $。

欲上小化的二次費用函式做


$ J=\ mathbb { E } \ left [{ \ mathbf { x } } _ { N } ^ { \ mathrm { T } } F { \ mathbf { x } } _ { N } + \ sum _ { i=零 } ^ { N 影一 } ( \ mathbf { x } _ { i } ^ { \ mathrm { T } } Q _ { i } \ mathbf { x } _ { i } + \ mathbf { u } _ { i } ^ { \ mathrm { T } } R _ { i } \ mathbf { u } _ { i } ) \ right] , $


$ F \ geq 零 , Q _ { i } \ geq 零 , R _ { i } > 零 . \ , $

離散時間的 LQG 控制器為


$ { \ hat { \ mathbf { x } } } _ { i + 一 }=A _ { i } { \ hat { \ mathbf { x } } } _ { i } + B _ { i } { \ mathbf { u } } _ { i } + L _ { i + 一 } \ left ( { \ mathbf { y } } _ { i + 一 }-C _ { i + 一 } \ left \ { A _ { i } { \ hat { \ mathbf { x } } } _ { i } + B _ { i } u _ { i } \ right \ } \ right ) , { \ hat { \ mathbf { x } } } _ { 零 }=\ mathbb { E } [{ \ mathbf { x } } _ { 零 }] $ ,


$ \ mathbf { u } _ { i }=-K _ { i } { \ hat { \ mathbf { x } } } _ { i } . \ , $

卡爾曼增益等於


$ { \ mathbf { } } L _ { i }=P _ { i } C _ { i } ^ { \ mathrm { T } } ( C _ { i } P _ { i } C _ { i } ^ { \ mathrm { T } } + W _ { i } ) ^ { 影一 } , $

其中 $ { \ mathbf { } } P _ { i } $ 是以下依時間向頭前進的矩陣 Riccati 差分方程所決定:


$ P _ { i + 一 }=A _ { i } \ left ( P _ { i }-P _ { i } C _ { i } ^ { \ mathrm { T } } \ left ( C _ { i } P _ { i } C _ { i } ^ { \ mathrm { T } } + W _ { i } \ right ) ^ { 影一 } C _ { i } P _ { i } \ right ) A _ { i } ^ { \ mathrm { T } } + V _ { i } , P _ { 零 }=\ mathbb { E } \ left ( { \ mathbf { x } } _ { 零 }-{ \ hat { \ mathbf { x } } } _ { 零 } \ right ) \ left ( { \ mathbf { x } } _ { 零 }-{ \ hat { \ mathbf { x } } } _ { 零 } \ right ) ^ { \ mathrm { T } } . $

回授增益矩陣為


$ { \ mathbf { } } K _ { i }=( B _ { i } ^ { \ mathrm { T } } S _ { i + 一 } B _ { i } + R _ { i } ) ^ { 影一 } B _ { i } ^ { \ mathrm { T } } S _ { i + 一 } A _ { i } $

\ 其中 $ { \ mathbf { } } S _ { i } $ 是以下的時間從後進前算的矩陣 Riccati 差分方程所決定:


$ S _ { i }=A _ { i } ^ { \ mathrm { T } } \ left ( S _ { i + 一 }-S _ { i + 一 } B _ { i } \ left ( B _ { i } ^ { \ mathrm { T } } S _ { i + 一 } B _ { i } + R _ { i } \ right )^ { 影一 } B _ { i } ^ { \ mathrm { T } } S _ { i + 一 } \ right ) A _ { i } + Q _ { i } , \ quad S _ { N }=F . $

若問題中所有的矩陣攏是非時變的,而且時間長度 $ { \ mathbf { } } N $ 趨勢強欲無窮大,是離散時間的 LQG 控制台就是非時變的。現此時矩陣 Riccati 差分方程會當用離散的時間的代數 Riccati 風程取代。會當決定非時變的離散線性兩擺估測器,猶閣有非時變的離散 LQR 控制器。為著欲予費用是有限值,會曉用 $ { \ mathbf { } } J / N $ 來代替 $ { \ mathbf { } } J $。

降級 LQG 問題

佇傳統 LQG 設定中,當系統維度真大的時陣,實現 LQG 控制器會有困難。降級 LQG 問題(reduced-order LQG problem)嘛叫做固定階數 LQG 問題(fixed-order LQG problem)先設定矣啦 LQG 控制的狀態數。因為分離原理已經無適用,這个問題會閣較無簡單求解,而且其解嘛無唯一。就算按呢,降級 LQG 問題已經有袂少的數值演算法會當求解相關的最佳投影方程(optimal projection equations), 其中建構矣局部上好化的降階 LQG 問題的充份佮必要條件。

LQG 控制的勇健性

LQG 最佳化本身無確保有良好的強健性,需要咧設計予好 LQG 控制了後,另外確認閉迴路系統的勇健穩定性。為著提昇系統的勇健性,可能會共一寡系統參數由確定值改假設是隨機值。相關的控制問題會閣較複雜,會得著一个類似的最佳控制器,干焦控制器參數無仝。

相關條目

  • 隨機控制
  • Witsenhausen 反例

參考資料

延伸閱讀

  • Stengel , Robert F . Optimal Control and Estimation . New York : Dover . 一千九百九十四 . ISBN  空抹四百八十六鋪六七八千二百鋪五 .