跳至內容
主選單
主選單
移至側邊欄
隱藏
導覽
首頁
近期變更
隨機頁面
MediaWiki說明
Taiwan Tongues 台語維基
搜尋
搜尋
外觀
建立帳號
登入
個人工具
建立帳號
登入
檢視 LQG控制 的原始碼
頁面
討論
臺灣正體
閱讀
檢視原始碼
檢視歷史
工具
工具
移至側邊欄
隱藏
操作
閱讀
檢視原始碼
檢視歷史
一般
連結至此的頁面
相關變更
特殊頁面
頁面資訊
外觀
移至側邊欄
隱藏
←
LQG控制
由於以下原因,您無權編輯此頁面:
您請求的操作只有這些群組的使用者能使用:
使用者
、taigi-reviewer、apibot
您可以檢視並複製此頁面的原始碼。
'''LQG 控制'''(linear–quadratic–Gaussian control)全名是'''線性二改高斯控制''',是控制理論中的基礎最佳控制問題之一。此問題佮存在高斯白噪音的線性系統有關係。此問題是愛揣著最佳的輸出回授律,會當予二改費用函式的期值上小化。其輸出量測假設受著高斯噪聲的影響,其初值嘛是高斯隨機向量。 佇咧「使用線性控制律」的最佳控制假使若是,會用得 completion-of-squares 論述進行推導。此控制律就開始來'''LQG 控制器''',就是卡爾曼濾波(線性二次狀態估測器,LQE)和 LQR 控制器的結合。分離原理指出狀態估測器佮狀態回授會用獨立設計。LQG 控制會當應用佇線性的時陣無變系統佮線性的時陣變系統,產生容易計算以及實現的線性動態回授控制器。LQG 控制器本身是一个類似其受控系統的動態系統,兩个人有仝款的維度。 根據分離原理,佇咧一寡範圍較闊可能是非線性的控制器內底,LQG 控制器猶原是上好的。也就是講「使用非線性控制架構無一定會當改善費用函的期望值」。 這个版本的分離原理是隨機控制的分離原理(separation principle of stochastic control)講著就算過程佮輸出雜訊源可能是非高斯七,只要其系統動態是線性的,其實上好控制猶會當分離做最佳狀態估測器(不再是卡爾曼濾波器)佮 LQR 控制器。LQR 控制器嘛有用來控制擾動的非線性系統。 ==問題佮解的數學描述== ===連紲時間=== 考慮連紲時間的線性動態系統 : $ { \ dot { \ mathbf { x } } } ( t )=A ( t ) \ mathbf { x } ( t ) + B ( t ) \ mathbf { u } ( t ) + \ mathbf { v } ( t ) , $ : $ \ mathbf { y } ( t )=C ( t ) \ mathbf { x } ( t ) + \ mathbf { w } ( t ) , $ 其中 $ { \ mathbf { x } } $ 是系統狀態變數的向量,$ { \ mathbf { u } } $ 是控制輸入向量,$ { \ mathbf { y } } $ 是輸出量測值的向量,可用佇回授的頂懸。系統受著加成性的高斯系統雜訊 $ \ mathbf { v } ( t ) $ 佮加成性的高斯量測雜訊 $ \ mathbf { w } ( t ) $ 所的影響。予定一系統,其目標是揣著一控制輸入 $ { \ mathbf { u } } ( t ) $,此控制輸入佇每一个時間 $ { \ mathbf { } } t $ 落,佮往過的量測量 $ { \ mathbf { y } } ( t') , 零 \ leq t'< t $ 有線性關係,啊而且這控制輸入會當予以下的費用函式有上細漢值: : $ J=\ mathbb { E } \ left [{ \ mathbf { x } ^ { \ mathrm { T } } } ( T ) F { \ mathbf { x } } ( T ) + \ int _ { 零 } ^ { T } { \ mathbf { x } ^ { \ mathrm { T } } } ( t ) Q ( t ) { \ mathbf { x } } ( t ) + { \ mathbf { u } ^ { \ mathrm { T } } } ( t ) R ( t ) { \ mathbf { u } } ( t ) \ , dt \ right] , $ : $ F \ geq 零 , \ quad Q ( t ) \ geq 零 , \ quad R ( t ) > 零 , $ 其中 $ \ mathbb { E } $ 為期望值。終其尾的時間(horizon)$ { \ mathbf { } } T $ 可能是有限值抑是無限值。如果最終時間為無限,則費用函式的第一項 $ { \ mathbf { x } } ^ { \ mathrm { T } } ( T ) F { \ mathbf { x } } ( T ) $ 會使失覺察,和問題沒關係。為著欲予費用函式為有限值,會定義費用函式做 $ { \ mathbf { } } J / T $。 求解述 LQG 問題的 LQG 控制器會當用下跤程表示: : $ { \ dot { \ hat { \ mathbf { x } } } } ( t )=A ( t ) { \ hat { \ mathbf { x } } } ( t ) + B ( t ) { \ mathbf { u } } ( t ) + L ( t ) \ left ( { \ mathbf { y } } ( t )-C ( t ) { \ hat { \ mathbf { x } } } ( t ) \ right ) , \ quad { \ hat { \ mathbf { x } } } ( 零 )=\ mathbb { E } \ left [{ \ mathbf { x } } ( 零 ) \ right] , $ : $ { \ mathbf { u } } ( t )=-K ( t ) { \ hat { \ mathbf { x } } } ( t ) . $ 矩陣 $ { \ mathbf { } } L ( t ) $ 講號做卡爾曼增益(Kalman gain), 佮第一个方程卡爾曼濾波有關係。佇時間 $ { \ mathbf { } } t $,濾波器會根據過去量測佮輸入來產生狀態 $ { \ mathbf { x } } ( t ) $ 的估測值 $ { \ hat { \ mathbf { x } } } ( t ) $。卡爾曼增益 $ { \ mathbf { } } L ( t ) $ 是根據 $ { \ mathbf { } } A ( t ) , C ( t ) $、二个佮白色高斯雜訊有關密度矩陣 $ \ mathbf { v } ( t ) $、$ \ mathbf { w } ( t ) $ 猶閣有最後的 $ \ mathbb { E } \ left [{ \ mathbf { x } } ( 零 ) { \ mathbf { x } } ^ { \ mathrm { T } } ( 零 ) \ right] $ 來計算。這五个矩陣會透過以下的矩陣 Riccati 微分方程來決定卡爾曼增益: : $ { \ dot { P } } ( t )=A ( t ) P ( t ) + P ( t ) A ^ { \ mathrm { T } } ( t )-P ( t ) C ^ { \ mathrm { T } } ( t ) { \ mathbf { } } W ^ { 影一 } ( t ) C ( t ) P ( t ) + V ( t ) , $ : $ P ( 零 )=\ mathbb { E } \ left [{ \ mathbf { x } } ( 零 ) { \ mathbf { x } } ^ { \ mathrm { T } } ( 零 ) \ right] . $ 假使其解 $ P ( t ) , 零 \ leq t \ leq T $,是卡爾曼增益等於 : $ { \ mathbf { } } L ( t )=P ( t ) C ^ { \ mathrm { T } } ( t ) W ^ { 影一 } ( t ) . $ 矩陣 $ { \ mathbf { } } K ( t ) $ 回授增益(feedback gain)矩陣,是由 $ { \ mathbf { } } A ( t ) , B ( t ) , Q ( t ) , R ( t ) $ 佮 $ { \ mathbf { } } F $ 矩陣,透過以下的矩陣 Riccati 微分方程來決定 : $-{ \ dot { S } } ( t )=A ^ { \ mathrm { T } } ( t ) S ( t ) + S ( t ) A ( t )-S ( t ) B ( t ) R ^ { 影一 } ( t ) B ^ { \ mathrm { T } } ( t ) S ( t ) + Q ( t ) , $ : $ { \ mathbf { } } S ( T )=F . $ 假使其解 $ { \ mathbf { } } S ( t ) , 零 \ leq t \ leq T $,回授增益等於 : $ { \ mathbf { } } K ( t )=R ^ { 影一 } ( t ) B ^ { \ mathrm { T } } ( t ) S ( t ) . $ 觀察咧講二个矩陣 Riccati 微分方逝,第一个沿時間進前後壁算,第二个是沿時間從後改算,這號做「嘿尪仔性」。 頭一个矩陣 Riccati 微分方程解了線性平方估測問題(LQE), 第二个矩陣 Riccati 微分方程解了 LQR 控制器問題。這兩个問題嘿尪仔,合起來就解了線性平方高斯控制問題(LQG ),所以 LQG 問題分做 LQE 問題以及 LQR 問題,而且會使獨立求解,所以 LQG 問題是「會當分離的」。 當 $ { \ mathbf { } } A ( t ) , B ( t ) , C ( t ) , Q ( t ) , R ( t ) $ 佮雜訊密度矩陣 $ \ mathbf { } V ( t ) $ , $ \ mathbf { } W ( t ) $ 袂隨時間咧變化 $ { \ mathbf { } } t $,而且 $ { \ mathbf { } } T $ 較無限大時間,LQG 控制器會變做非時變動態系統。現此時欲出二个矩陣 Riccati 微分方程會變做代數 Riccati 四角勢。 ===離散的時間=== 離散時間的 LQG 控制問題佮連紲時間下的問題相倚,所以下跤干焦關注其數學式。 離散時間的線性系統方程為 : $ { \ mathbf { x } } _ { i + 一 }=A _ { i } \ mathbf { x } _ { i } + B _ { i } \ mathbf { u } _ { i } + \ mathbf { v } _ { i } , $ : $ \ mathbf { y } _ { i }=C _ { i } \ mathbf { x } _ { i } + \ mathbf { w } _ { i } . $ 其中 $ \ mathbf { } i $ 是離散時間,$ \ mathbf { v } _ { i } , \ mathbf { w } _ { i } $ 是離散時間高斯白雜訊的過程,其共變做異數矩陣為 $ \ mathbf { } V _ { i } , W _ { i } $。 欲上小化的二次費用函式做 : $ J=\ mathbb { E } \ left [{ \ mathbf { x } } _ { N } ^ { \ mathrm { T } } F { \ mathbf { x } } _ { N } + \ sum _ { i=零 } ^ { N 影一 } ( \ mathbf { x } _ { i } ^ { \ mathrm { T } } Q _ { i } \ mathbf { x } _ { i } + \ mathbf { u } _ { i } ^ { \ mathrm { T } } R _ { i } \ mathbf { u } _ { i } ) \ right] , $ : $ F \ geq 零 , Q _ { i } \ geq 零 , R _ { i } > 零 . \ , $ 離散時間的 LQG 控制器為 : $ { \ hat { \ mathbf { x } } } _ { i + 一 }=A _ { i } { \ hat { \ mathbf { x } } } _ { i } + B _ { i } { \ mathbf { u } } _ { i } + L _ { i + 一 } \ left ( { \ mathbf { y } } _ { i + 一 }-C _ { i + 一 } \ left \ { A _ { i } { \ hat { \ mathbf { x } } } _ { i } + B _ { i } u _ { i } \ right \ } \ right ) , { \ hat { \ mathbf { x } } } _ { 零 }=\ mathbb { E } [{ \ mathbf { x } } _ { 零 }] $ , : $ \ mathbf { u } _ { i }=-K _ { i } { \ hat { \ mathbf { x } } } _ { i } . \ , $ 卡爾曼增益等於 : $ { \ mathbf { } } L _ { i }=P _ { i } C _ { i } ^ { \ mathrm { T } } ( C _ { i } P _ { i } C _ { i } ^ { \ mathrm { T } } + W _ { i } ) ^ { 影一 } , $ 其中 $ { \ mathbf { } } P _ { i } $ 是以下依時間向頭前進的矩陣 Riccati 差分方程所決定: : $ P _ { i + 一 }=A _ { i } \ left ( P _ { i }-P _ { i } C _ { i } ^ { \ mathrm { T } } \ left ( C _ { i } P _ { i } C _ { i } ^ { \ mathrm { T } } + W _ { i } \ right ) ^ { 影一 } C _ { i } P _ { i } \ right ) A _ { i } ^ { \ mathrm { T } } + V _ { i } , P _ { 零 }=\ mathbb { E } \ left ( { \ mathbf { x } } _ { 零 }-{ \ hat { \ mathbf { x } } } _ { 零 } \ right ) \ left ( { \ mathbf { x } } _ { 零 }-{ \ hat { \ mathbf { x } } } _ { 零 } \ right ) ^ { \ mathrm { T } } . $ 回授增益矩陣為 : $ { \ mathbf { } } K _ { i }=( B _ { i } ^ { \ mathrm { T } } S _ { i + 一 } B _ { i } + R _ { i } ) ^ { 影一 } B _ { i } ^ { \ mathrm { T } } S _ { i + 一 } A _ { i } $ \ 其中 $ { \ mathbf { } } S _ { i } $ 是以下的時間從後進前算的矩陣 Riccati 差分方程所決定: : $ S _ { i }=A _ { i } ^ { \ mathrm { T } } \ left ( S _ { i + 一 }-S _ { i + 一 } B _ { i } \ left ( B _ { i } ^ { \ mathrm { T } } S _ { i + 一 } B _ { i } + R _ { i } \ right )^ { 影一 } B _ { i } ^ { \ mathrm { T } } S _ { i + 一 } \ right ) A _ { i } + Q _ { i } , \ quad S _ { N }=F . $ 若問題中所有的矩陣攏是非時變的,而且時間長度 $ { \ mathbf { } } N $ 趨勢強欲無窮大,是離散時間的 LQG 控制台就是非時變的。現此時矩陣 Riccati 差分方程會當用離散的時間的代數 Riccati 風程取代。會當決定非時變的離散線性兩擺估測器,猶閣有非時變的離散 LQR 控制器。為著欲予費用是有限值,會曉用 $ { \ mathbf { } } J / N $ 來代替 $ { \ mathbf { } } J $。 ==降級 LQG 問題== 佇傳統 LQG 設定中,當系統維度真大的時陣,實現 LQG 控制器會有困難。'''降級 LQG 問題'''(reduced-order LQG problem)嘛叫做'''固定階數 LQG 問題'''(fixed-order LQG problem)先設定矣啦 LQG 控制的狀態數。因為分離原理已經無適用,這个問題會閣較無簡單求解,而且其解嘛無唯一。就算按呢,降級 LQG 問題已經有袂少的數值演算法會當求解相關的最佳投影方程(optimal projection equations), 其中建構矣局部上好化的降階 LQG 問題的充份佮必要條件。 ==LQG 控制的勇健性== LQG 最佳化本身無確保有良好的強健性,需要咧設計予好 LQG 控制了後,另外確認閉迴路系統的勇健穩定性。為著提昇系統的勇健性,可能會共一寡系統參數由確定值改假設是隨機值。相關的控制問題會閣較複雜,會得著一个類似的最佳控制器,干焦控制器參數無仝。 ==相關條目== * 隨機控制 * Witsenhausen 反例 ==參考資料== ==延伸閱讀== * Stengel , Robert F . Optimal Control and Estimation . New York : Dover . 一千九百九十四 . ISBN 空抹四百八十六鋪六七八千二百鋪五 . [[分類: 待校正]]
返回到「
LQG控制
」。