全基因組關聯分析
全基因組關聯分析(Genome-wide association study)是講佇咧人類全基因組範圍內底揣出存在的序列變化,即單核酸酸多態性(SNP), 對內底篩選出佮疾病相關的 SNPs。
研究歷史
- 二空空五年,Science 雜誌報導第一項有年歲相關性的黃斑變性 GWAS 研究。
- 了後陸續出現了有關心病、大箍、二形糖尿病、三酸甘油址、精神分裂症以及相關表型的報導。
- Genetic Epidemiology、Biometrics 等雜誌嘛佇咧遺傳統計學角度著 GWAS 進行了數據統計學方向的探討佮研究,以實現低成本、高效益地揣著遺傳標記和疾病間的關聯,同時解決 GWAS 分析過程中出現的假陽性問題。
應用前景
GWAS 做人拍開一扇通往研究複雜疾病的大門,共佇患者全基因組範圍內底檢測出的 SNP 位點佮對照組進行較,揣出所有的變異等位的基因頻率,對咧避免親像候選基因策略仝款需要預先假使病基因。同時,GWAS 研究予咱揣著真濟毋捌發現的基因以及染色的體區域,是複雜疾病的發病機制提供閣較濟的線索。
統計分析原理
是因為無關係個體的關聯分析
- 病例對照研究設計:主要用來研究質量性狀,是毋是有患病。
- 是因為隨機人群的關聯分析:主要用來研究數量性狀。
是因為家系的關聯研究
佇咧研究是因為平常時仔,採用傳遞不平衡檢驗(TDT)分析遺傳標記佮疾病數量表型佮質量表型的關聯會當排除人群濫濫做伙對關聯分析的影響,毋過其在發現陽性關聯的檢驗方面不如相仝本量的病例對照研究有效。
FBAT 是運用十分廣泛的基於家系的統計分析工具,會當分析質量性狀佮數量性、調整濫雜因素、分析基因-環境互相作用、分析單倍型、撨予偌重較等。
單體型的分析研究的必要性
一 . 濟位點單體型分析會當發現單體型-疾病表型之間的關聯,這款關聯愛明顯強蹛孤一个所在-疾病表型之間的關聯。 二 . 單體型分析會當發現非 TagSNPs 佮疾病之間的因果關係。
研究設計表型選擇
一 . 選擇遺傳度較懸的疾病抑是講表型來進行檢測會當提升遺傳學關聯研究的把握度。 二 . 因為有時病症真歹測量也是加種病症透濫做伙造成疾病狀態的分辨困難,研究疾病相關的數量表型愛比研究疾病的狀態較好看著。 三 . 因為測量數量表型的困難程度佮該表型的遺傳度相關,通過控制測量精差、噪音佮總體變化會當加強數量表型變化佮遺傳因素的比例關係,所以一般選擇測量簡單準確並且遺傳度相對較懸的數量表型。
研究設計類型
單一个階段研究
孤一个階段研究即在有真大的病例佮對照本數量了後,一改性地著其實所有選著的 SNP 進行基因分型,然後分析逐个 SNP 佮疾病的關聯,計算是其關聯強度佮 OR 值。因為項本數量需求量大,單階段研究基因分型一般消磨大摸。
兩个抑是講真濟階段研究
用小項本數量進行第一階段的全基因組範圍 SNP 基因分型,統計分析過後一般會當篩選少量陽性 SNPs,了後的第二階段閣再佇咧更加大數量的樣本中對遮的陽性 SNPs 進行基因分型,上尾仔整合兩个階段的結果進行分析。研究證明 DNA pool 佮微陣列試劑盒仔會當降低基因分型的工作量,會當進行低成本高效益的 SNP 篩選。
偌重假使檢驗調整
- Bonferroni 學校正法
- 遞減調整法(Step-Down Adjustment)
- 模擬運算法 ( Permutation )
- 控制錯誤發現率法 ( False discovery rate )
研究的重複
因為 GWAS 研究的各種的研究設計方法猶閣有遺傳統計方法無法度對根本上消除人群濫濫做伙、加重較造成的假陽性,咱需要通過重複研究來保證遺傳標記和疾病間的真關聯。
一 . 通過增大樣本數量來提懸檢驗效率,增加佮疾病相關聯 SNPs 的概率。 二 . 佇咧兩个人陣內底分別對樣本中所有的 SNP 進行基因分型,了後閣交換重複測量對方得著的陽性 SNPs。按呢做頭先保證矣低假陰性率,隨後佇咧較大樣本中重複陽性結果閣上大的程度避免假日頭的產生。
存在的問題
一 . 人群透濫(Population Stratification)是佇大樣本研究中致使假陽性、假陰性結果出現的重要原因之一。使用分層分數法(Stratification-score approach)控制人群分層、運用統計分析手段控制人群雜種影響、採用基於家系的關聯研究攏會當避免人群濫濫做伙對關聯結果分析的影響。 二 . 解說基因-變異-環境的因素之間的互相作用關係需要使用 GWAS 著閣較濟微效的佮疾病關聯的基因變化進行研究。 三 . 數據共享是使用 GWAS 得著遺傳標記佮疾病確切關聯的必要手段,就算講難度真大,毋過佇咧研究複雜疾病的遺傳變化內底會當發揮重要的作用。
參看
- 流行病學
- 基因組學
- 連鎖無平衡
- 分子流行病學