跳至內容

BED(文件格式)

出自Taiwan Tongues 台語維基
這是此頁批准,以及是最近的修訂。

BED(Browser Extensible Data,字面意思是「(基因組)瀏覽器會當延展數據」)是一種基因組學中用於表示、標記基因組區域位信息內底的文件格式,佇咧人類基因組計劃內底頭一改出現。BED 文件是目前基因組學的事實上的標準格式之一。

格式

引入來 BED 格式的人類基因組計畫並無詳細的規範 BED 文件格式,因此一般較通用加州大學聖克魯茲分校(UCSC)基因組瀏覽器內底攏咧講文件。二空二一年,全球基因組學佮健康聯盟(GA 四 GH)發佈了頭一份 BED 文件格式的規範文件。

BED 文件上少需要有三个分別表示區域染色體序號、起先位置,猶閣有終止位置的列,根據無仝需求會當增加至十二列記錄閣較濟信息。一般來講,無仝的列之間應以制表符分隔值(\ t)隔開,而且伊每一逝的列數著愛相𫝛。

下表介紹 BED 文件每一列應該愛儉的信息。三个著愛出現的列標記為紅色的。

頭行文件

一部份 BED 文件會具有一寡佮 BED 文件本身無關係的頭行文件,一般包含以下的批評

  • " browser ":佮 UCSC 基因組瀏覽器設置相關的參數
  • " track " : 佮基因組瀏覽器內底會當看著參數設置相關
  • " # ":注釋內容,內容任意

文件擴展名

BED 文件的擴展名一般為「. bed」。 有當時仔,嘛根據列數的無仝款標準「. bed 三」(有三列的 BED 文件)、「. bed 六」(有六列的 BED 文件)等咧。

以下為一个含有上基本三列批的 BED 文件範例:

` ` ` chr 七一石兩千七百四十七石一千一百九十六一孵兩千七百四十七陽兩千三百六十三 chr 七一孵兩千七百四十七陽兩千三百六十三一石兩千七百四十七陽三千五百三十 chr 七一石兩千七百四十七陽三千五百三十一孵兩千七百四十七陽四千六百九十七 ` ` `

以下是另外一个 BED 文件的範例,UCSC 基因組瀏覽器提供的 BED 文件一般攏是這種格式。頭三行是 UCSC 基因組瀏覽器的設置參數,佮 BED 文件本身無關係。

` ` ` browser position chr 七 : 一孵二千七百四十七孵一千一百九十六孵一孵兩千七百四十九孵五千七百二十 browser hide all track name=" ItemRGBDemo " description=" Item RGB demonstration " visibility=二 itemRgb=" On " chr 七一石兩千七百四十七石一千一百九十六一孵兩千七百四十七陽兩千三百六十三 Pos 一零 + 一石兩千七百四十七石一千一百九十六一孵兩千七百四十七陽兩千三百六十三兩百五十五 , 零 , 零 chr 七一孵兩千七百四十七陽兩千三百六十三一石兩千七百四十七陽三千五百三十 Pos 二零 + 一孵兩千七百四十七陽兩千三百六十三一石兩千七百四十七陽三千五百三十兩百五十五 , 零 , 零 chr 七一石兩千七百四十七陽三千五百三十一孵兩千七百四十七陽四千六百九十七 Pos 三零 + 一石兩千七百四十七陽三千五百三十一孵兩千七百四十七陽四千六百九十七兩百五十五 , 零 , 零 chr 七一孵兩千七百四十七陽四千六百九十七一鋪兩千七百四十七陽五千八百六十四 Pos 四零 + 一孵兩千七百四十七陽四千六百九十七一鋪兩千七百四十七陽五千八百六十四兩百五十五 , 零 , 零 chr 七一鋪兩千七百四十七陽五千八百六十四一鋪兩千七百四十七陽七千空三十一 Neg 一零-一鋪兩千七百四十七陽五千八百六十四一鋪兩千七百四十七陽七千空三十一零 , 零 , 兩百五十五 chr 七一鋪兩千七百四十七陽七千空三十一一石兩千七百四十七陽八千一百九十八 Neg 二零-一鋪兩千七百四十七陽七千空三十一一石兩千七百四十七陽八千一百九十八零 , 零 , 兩百五十五 chr 七一石兩千七百四十七陽八千一百九十八一石兩千七百四十七陽九千三百六十五 Neg 三零-一石兩千七百四十七陽八千一百九十八一石兩千七百四十七陽九千三百六十五零 , 零 , 兩百五十五 chr 七一石兩千七百四十七陽九千三百六十五一孵兩千七百四十八堵空五百三十二 Pos 五零 + 一石兩千七百四十七陽九千三百六十五一孵兩千七百四十八堵空五百三十二兩百五十五 , 零 , 零 chr 七一孵兩千七百四十八堵空五百三十二一孵兩千七百四十八撨一千六百九十九 Neg 四零-一孵兩千七百四十八堵空五百三十二一孵兩千七百四十八撨一千六百九十九零 , 零 , 兩百五十五 ` ` `

. genome 格式

genome 文件是一種有時間佮 BED 文件配合使用的文件。這種的文件有兩列,第一列是染色體序號、第二列表示這條染色體的長度。genome 文件主要是確保 BED 文件表示的區域袂佇咧染色體應該有的長度以外。

` ` ` chrom size chr 一二孵四千八百九十五鋪六千四百二十二 chr 二二陽四千兩百十九陽三千五百二十九 chr 三一石條九千八百二十九陽五千五百五十九 chr 四一石九千空二十一石四千五百五十五 chr 五一石八千一百五十三石八千兩百五十九 chr 六一四七千空八十五空五千九百七十九 chr 七一石五千九百三十四陽五千九百七十三 . . . ` ` `

參見

  • SAM ( 文件格式 )
  • GTF 文件

參考資料