国产精品视频一区二区三区四,亚洲av美洲av综合av,99国内精品久久久久久久,欧美电影一区二区三区电影

產(chǎn)品推薦:氣相|液相|光譜|質譜|電化學|元素分析|水分測定儀|樣品前處理|試驗機|培養(yǎng)箱


化工儀器網(wǎng)>技術中心>工作原理>正文

歡迎聯(lián)系我

有什么可以幫您? 在線咨詢

測序數(shù)據(jù)不好?是不是建庫出了問題?!

來源:翌圣生物科技(上海)股份有限公司   2019年05月17日 10:43  

HB190313

 

測序數(shù)據(jù)不好?是不是建庫出了問題?!

——從測序數(shù)據(jù)看文庫構建

高通量測序中的文庫構建指的是在DNA兩端連接特定的接頭從而使其符合測序平臺要求的過程,在高通量測序過程中,文庫質量直接影響終測序數(shù)據(jù)的質量,打個比方,如果文庫上機測序的濃度很低,樣本在FlowCell上擴增所形成的DNA樣本簇就會很少,測序數(shù)據(jù)量也將減少,這就可能導致測序失敗,所以我們說文庫的質量控制和質量評估也是NGS中的關鍵步驟。

文庫如何質控?

評估文庫質量的方法有哪些?

文庫質控:文庫在上機之前都有會進行質量檢測,質量檢測合格的文庫才會上機測序。文庫上機之前的文庫質控主要包括文庫片段大小和文庫濃度的質控,具體質控標準和實驗設計見往期推送:文庫質檢方案的合理設計--文庫分布、文庫濃度、文庫質量(超鏈接:h/t/t/ps://mp.weixin.qq.c/o/m/s/iM5eMweP1By6MoqrxOEBfw)。

文庫評估:文庫評估方法除了文庫大小和濃度之外,還包括文庫轉化率、文庫復雜度、均一性、準確性和覆蓋度等。

1)文庫轉化率:是評估文庫質量的重要指標,它指的是文庫中兩端都連上接頭的目的片段占總片段數(shù)的比值,也代表測得產(chǎn)量與理論高產(chǎn)量之間的比值,這里的理論高產(chǎn)量考慮了PCR的擴增效率問題及純化產(chǎn)生的損失。計算方法如下:

理論高產(chǎn)量=輸入量×(1+PCR擴增效率)(PCR循環(huán)數(shù))×(純化回收率)(clean up數(shù))

為什么說文庫轉化率是重要指標呢?這是因為只有雙端都連接上接頭的目的片段才能在FlowCell上面通過橋式擴增形成簇,終完成測序過程,而不是雙端都連上接頭的目的片段終都不能完成測序過程,視為無效片段,如果這樣的片段過多直接影響終輸出數(shù)據(jù)的過少,甚至可能直接導致測序的失敗。

 

圖1.雙端帶接頭的DNA片段在Flowcell上擴增圖

2)文庫復雜度:指的是文庫中DNA序列的復雜程度,一定的文庫復雜度對后期測序數(shù)據(jù)的分析尤為重要,復雜度高的文庫測序得到的數(shù)據(jù)重復讀數(shù)少,可以帶來更多有意義的信息,反之,低復雜度的文庫在信號讀取時往往產(chǎn)生簇信號混雜,易產(chǎn)生低質量的測序數(shù)據(jù)。

文庫復雜度與Input樣本質量、文庫的轉化率、文庫擴增時循環(huán)數(shù)有關。當文庫的轉化率越高時,能從樣品種捕獲更多的特異分子,文庫復雜度就越高;當輸入樣本量越低或文庫擴增循環(huán)數(shù)越多時,文庫中不能帶來有意義信息的重復讀數(shù)就會增多,則文庫的復雜度越低。

表1.測序數(shù)據(jù)關鍵參數(shù)比較

Sample Input

Library Prep

Uniquely Mapped

Duplication Rate

Transcripts Detected

Genes Detected

4 μg

A*

69%

31%

111.370

20.547

B*

76%

24%

112.136

21.016

500 μg

A*

64%

36%

109.810

20.134

B*

71%

29%

110.690

20.644

3)均一性:指的是讀取數(shù)據(jù)在基因組或目標區(qū)域的分布均一程度。其生信分析圖如圖2所示,一般認為覆蓋越均勻,達到特定深度所需的測序數(shù)據(jù)就越少,覆蓋均一性的偏向通常是在文庫制備和文庫擴增步驟中引入的,也就是說,覆蓋均一性很多時候取決于GC含量。

 

2.測序數(shù)據(jù)均一性

 

4)準確性:

NGS文庫制備的準確性越高,你對變異報告的信任程度就越高。核苷酸錯誤通常在PCR擴增以及測序過程中引入。測序錯誤通常低于1%。通過使用高保真PCR試劑,可盡量減少文庫擴增的錯誤。NGS對照樣品也有助于評估NGS流程的準確性。 

 

圖3.PCR擴增存在一定的錯配率

 

5)測序深度和覆蓋度

假設對長1000 bp的目標區(qū)域進行捕獲測序,每個read長10 bp,總共得到3000個reads,把所有的reads對比到目標區(qū)域后,1000 bp的目標區(qū)域中有990 bp的位置至少有1個read覆蓋到,換言之剩余的10bp沒有1個read覆蓋。

則此時:

測序深度(depth)3000*10/1000=30 也就是說測序深度為30*

覆蓋度(coverage)990/1000*100%=99% 這次測序覆蓋度為99%

同理:

假設對長100bp的目標區(qū)域進行捕獲測序,每個read長5bp,總共得到200個reads,把所有的reads對比到目標區(qū)域后,100bp的目標區(qū)域中有98bp的位置至少有1個read覆蓋到,換言之剩余的2bp沒有1個read覆蓋。

深度(depth)200*5/1000=10 也就是說測序深度為 10*

覆蓋度(coverage)98/100*100%=98% 這次測序覆蓋度為98%

文庫構建中的哪些步驟會直接影響測序質量?

NGS的終目的就是得到測序數(shù)據(jù)助力于下游科學研究或實際應用,其中文庫構建是測序數(shù)據(jù)的重要影響因素,文庫構建一般包括以下幾類步驟(以DNA為例):樣本片段化、接頭連接、分選/純化、文庫擴增。文庫對測序數(shù)據(jù)的影響,具體到文庫構建的每個步驟,參考表2。

 

表2.建庫步驟對測序結果的影響

步驟

評估指標

對測序結果的影響

樣本片段化

打斷隨機性

文庫質量;測序數(shù)據(jù)的均一性和覆蓋度

片段大小是否集中

文庫濃度;測序數(shù)據(jù)覆蓋度

接頭連接

接頭連接效率

文庫轉化率;文庫復雜度;均一性;準確性和覆蓋度

分選/純化

片段大小的一致性

片段大小與測序儀大小不匹配將無法上機測序

回收效率

文庫濃度;測序數(shù)據(jù)覆蓋度

文庫擴增

擴增偏好性

文庫復雜度;均一性

擴增效率

文庫濃度;文庫復雜度

 

 

 

免責聲明

  • 凡本網(wǎng)注明“來源:化工儀器網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡有限公司-化工儀器網(wǎng)合法擁有版權或有權使用的作品,未經(jīng)本網(wǎng)授權不得轉載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權使用作品的,應在授權范圍內(nèi)使用,并注明“來源:化工儀器網(wǎng)”。違反上述聲明者,本網(wǎng)將追究其相關法律責任。
  • 本網(wǎng)轉載并注明自其他來源(非化工儀器網(wǎng))的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責,不承擔此類作品侵權行為的直接責任及連帶責任。其他媒體、網(wǎng)站或個人從本網(wǎng)轉載時,必須保留本網(wǎng)注明的作品第一來源,并自負版權等法律責任。
  • 如涉及作品內(nèi)容、版權等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關權利。
企業(yè)未開通此功能
詳詢客服 : 0571-87858618
彩票| 乐清市| 汶上县| 喀喇沁旗| 淅川县| 东明县| 新晃| 策勒县| 咸阳市| 安远县| 遵化市| 固始县| 彭水| 泉州市| 乌什县| 安吉县| 宁南县| 镶黄旗| 昌乐县| 横山县| 西乌珠穆沁旗| 荥经县| 孟州市| 海晏县| 乐亭县| 阿城市| 芮城县| 大安市| 准格尔旗| 新昌县| 沧州市| 滦南县| 宜兰县| 北辰区| 新竹市| 宜州市| 屯留县| 仪陇县| 宝兴县| 闵行区| 读书|