Helicos
企業: Helicos Biosciences
推出時間: 2008年
主流型號: HeliScope? Single Molecule Sequencer(2008年推出)
樣品要求: 1-3 μg,起始DNA體積不超過100 μL.
測序原理: 邊合成邊測序,可逆阻斷測序
待測DNA被隨機打斷成小片段,在每個小片段(~200
bp)的末端加上poly-dA,并于玻璃芯片上隨機固定多個poly-dT引物,其末端皆帶有熒光標記,以利于精確定位。首先,將小片段DNA模板與檢測芯片上的poly-dT引物進行雜交并精確定位,然后逐一加入熒光標記的末端終止子。這個終止子與Illumina的終止子可不一樣,不是四色的,是單色的,也就是說所有終止子都標有同一種染料。在摻入了單個熒光標記的核苷酸后,洗滌,單色成像,之后切開熒光染料和抑制基團,洗滌,加帽,允許下一個核苷酸的摻入。通過摻入、檢測和切除的反復循環,即可實時讀取大量序列。最后以軟件系統輔助,可分析出完整的核酸序列。
文庫制備: Fragment, Mate-pair
模板制備: 單分子檢測
讀長: 25-55 bp,平均35 bp
測序通量: 21 to 35 Gb/run
時間/run: 8 days
堿基精確度: >20X覆蓋度時一致性超過99.995%
變異檢測能力(DNA重測序方面): SNP, CNV
成本: 儀器$999,000/臺,測序$0.45-0.60/Megabase.
數據格式: Raw data:srf或者sms格式
分析軟件: 推薦用Helisphere開放資源軟件進行過濾比對
優點: 真正的單分子測序,無需前期擴增,不引入偏向性;特別適合RNA-Seq或RNA直接測序的應用,因為它能直接測序RNA模板,而無需將其轉化成cDNA。檢測堿基替換突變的誤差率非常低,~0.2%。
缺點: 錯誤率高,Insertion 1.5%,Deletion 3.0%;Heliscope在面對同聚物時也會遇到一些困難,但可以通過二次測序提高準確度;由于在合成中可能摻有未標記的堿基,因此其最主要的錯誤來源是缺失。
經典案例: 1.Single-molecule sequencing of an individual human genome.
Dmitry Pushkarev,Norma F Neff & Stephen R Quake.Nat Biotechnol, 27. (9): 847-852.
(更多詳見
http://www.helicosbio.com/HeliSp ... id/169/Default.aspx)
備注: 特別適合RNA-Seq或RNA直接測序的應用
DNA Nanoball array
企業: Pacific Biosciences
推出時間: 2009年底Science論文發表,2010年推出
主流型號: DNA Nanoball array
樣品要求: DNA 由
PicoGreen定量:推薦10ug,最少7.5ug。濃度:75-150ng/ul;體積:50-200ul;DNA長度:大分子量雙鏈基因組DNA,大部分超過20kb.
測序原理: 邊連接邊測序
采用了高密度DNA(玻璃板)納米芯片技術和非連續、非連鎖聯合探針錨定連接(cPAL)技術來進行測序。基因組隨機打斷成500bp隨機長度的片段,兩端接上接頭,成環,限制性內切酶酶切,重復2次,最終連接成一個DNA環,現階段4接頭建庫方法能夠支持70bp單端測序(35bp雙端測序)。接著,所示,每個DNA環在反應液中高速擴增,形成一個納米球(DNB),這樣每一個DNA環大約擴增了200次。然后把這些納米球平鋪到預先處理過的玻璃板上,形成納米芯片。最后通過非連鎖聯合探針錨定連接(cPAL)技術進行測序,10bp長的探針上有一個錨定堿基(A
or T or G or
C),其他位置都是N,通過與模板的雜交連接反應,根據4種不同的堿基(A/T/G/C)會有四種不同的熒光信號,總共需要40種不同的錨定探針。每一種錨定探針雜交之后都會進行洗脫。通過DNB芯片的熒光顯影結果及解碼分析,我們可以確定每個DNB的核酸序列。
文庫制備: 500bp
模板制備: 納米球(DNB)
讀長: 35PE
測序通量: 20-60G/run/flow slide,共18 個flow slide
時間/run: 9 days
堿基精確度: 99.999%
變異檢測能力(DNA重測序方面): SNP、Indel、SV、CNV
成本: 只提供測序服務,不出售儀器。09年11月的WGS成本為$1726 (45×),$8005 (87×)
數據格式: 基礎文本格式,*.tsv。可交付結果包括:序列變異、功能注釋、數據總結報告 及一整套上述結果的支持數據。
數據由三部分組成,主要部分是reads和mappings,其次是assambly 和variations,summary report最少
分析軟件: Genome comparison tools
Format conversion tools
Annotation tools
Reference tools
,在開發中的還有用于癌癥基因組分析的腫瘤-正常樣本比對工具和用于家族基因組分析的工具,還有大規模比對工具可以同時比對數百個基因組。Complete Genomics Assembly Pipeline version 1.5.0
優點: 測序自動化,成本低,通量大
缺點: 讀長短,分析軟件不公開,樣品要求高
經典案例: Identification by whole-genome resequencing of
gene defect responsible for severe hypercholesterolemia. Jonathan Rios,
et al. Human Molecular Genetics, Volume19, Issue22 Pp. 4313-4318.
Human Genome Sequencing Using Unchained Base Reads
on Self-Assembling DNA Nanoarrays.Radoje Drmanac1,et al. Science, Vol.
327 no. 5961 pp. 78-81 .
Analysis of Genetic Inheritance in a Family Quartet
by Whole-Genome Sequencing. Jared C. Roach,et al. Science, Vol. 328 no.
5978 pp. 636-639
The mutation spectrum revealed by paired genome
sequences from a lung cancer patient.William Lee,et al.Nature
,Volume:465, Pages: 473–477
備注: mapping reads:40X/genome
The PacBio RS system
企業: Pacific Biosciences
推出時間: 2010年2月開始早期試用
主流型號: PacBio RS
樣品要求: 1kb以下500ng,純化的基因組 DNA, BACs, cDNA 文庫 或PCR 產物
測序原理: 邊合成邊測序,single molecule, real-time, or SMRT?, technology
這項技術的核心在于使用了Zero-Mode
Waveguide(ZMW)(零波段邊界)。測序的平臺上有幾萬個小井,單個DNA聚合酶和要測序的DNA鏈固定在每一個小井里。帶有熒光標記的脫氧核苷酸(A,T,C,G)被加入到每個小井里。每一種脫氧核苷酸在激化后分別能放出不同波長的熒光。小井的底部開了一個非常小的孔,小到比探測激光的單個波長還要短。根據我們的常識,這個孔太小了,激光無法從井的底部穿過去,從而無法激發脫氧核苷酸上的熒光物質。應此,底部的顯微鏡檢測到的是一片黑暗。但是我們知道光線是一種波,它會衍射,激光雖然不能完全穿過小孔照亮整個小井,但它能透過小孔而勉強照亮小孔附近很小的一個區域。而DNA聚合酶正好被固定在這個小區域。當有單個脫氧核苷酸加載在DNA聚合酶上形成新的化學鍵時,這個脫氧核苷酸上的熒光物質被激活而發光,從而被顯微鏡觀測到。這種特定顏色的熒光只持續一小段時間,應為這個堿基在DNA鏈上合成之后,它的熒光基團就會被剪切掉,從而繼續下一個堿基的合成。當DNA鏈合成結束之時也是DNA鏈測序完成之時。但DNA聚合酶的活性會在激光照射下逐漸減弱,不能無限長度的進行合成反應,因此DNA鏈的測序長度也是有限的。
文庫制備: Fragment, Mate-pair (250bp-6kb)
模板制備: SMRTbell? library, 無需常規擴增,1kb以下的文庫只需要500ng樣品
讀長: 1000bp
測序通量: 高靈活性的測序通量
時間/run: 模板制備到 primary basecall analysis只需不到一天,一般只需要不到4個小時.
堿基精確度: 準確率社會評價不高,2011年1月發表的NEJM雜志(關于海地霍亂的測序)在其supplementary提到它的單堿基準確率只有81-83%。
關于其準確率的社會評價不好,有網站稱其準確度很差,單次測序平均錯誤率15%,循環測序后降至8%
變異檢測能力(DNA重測序方面): SNP、Indel、SV、CNV,可以直接進行甲基化等修飾測序,方便表觀研究
成本: $700,000 per machine,$99 per SMRTTMCell, each patterned with 15,000ZMW, each ZMW contain a single DNA polymerase.
數據格式: bas.h5 – Base File and Filtered Bases File - Documentation
cmp.h5 – Reference Mapped File and Consensus File - Documentation
分析軟件: mapping:BLASR (Basic Linear Alignment with
Successive Refinement);組裝:ALLORA (A Long Read Assembler);SNP 和Indel :
RCCS (Reference Circular Consensus Sequencing) 客戶端軟件:SMRT
Portal;提供:experiment specific, data-rich reports in industry-standard
output formats containing both primary and secondary analysis
data。可以使用第三方軟件。
優點: 讀長長;無需PCR擴增,也避免了由此帶來的bias;需要的樣品量很少;樣品制備時間花費少;用RS系統可以遠程快速獲取數據和選擇測序參數;通量靈活;時間快
缺點: 準確性低,需要循環測序,
經典案例: The Origin of the Haitian Cholera Outbreak StrainChen-Shan Chin,et al.N Engl J Med 2011; 364:33-42January 6, 2011.
Real-Time DNA Sequencing from Single Polymerase Molecules.John Eid, et al.Science 2 January 2009:
Vol. 323 no. 5910 pp. 133-138
DOI: 10.1126/science.1162986
備注: 1.在樣品制備好后,有一個run design的步驟,可以在客戶電腦上用RS remote
軟件來自主選擇運行方式和后續的個性化分析服務,以及第一時間接受測序數據2.截止2011年5月份已正式發售了多臺RS測序儀,其中包括美國國家生化防衛分析與對策中心(NBACC)和冷泉港實驗室。
PGM
企業: Ion Torrent
推出時間: 2010年
主流型號: Ion Personal Genome Machine?(2010年)
樣品要求: 5 μg DNA,起始DNA體積不超過130μL
測序原理: 半導體芯片測序
該測序儀使用了一種高密度半導體小孔芯片。該芯片置于一個離子敏感層和離子感受器之上,每當有核苷酸分子被摻入時就會釋放出質子,而離子感受器就會感受到這種信號,知道是哪一個核苷酸被摻入,從而讀出DNA序列。
文庫制備: Fragment(185–210 bp)
模板制備: PCR擴增
讀長:
314芯片,100 bp;
316芯片,100bp;
318芯片,200 bp。
測序通量:
314芯片,10 Mb/run;
316芯片,100 Mb/run;
318芯片,1Gb/run。
時間/run: 2 hours
堿基精確度: 一致性超過99.99%,>99.5% raw accuracy.
變異檢測能力(DNA重測序方面): SNP, Indel
成本: 儀器$50,000 /臺,測序$500/run
數據格式: 標準的SFF或者FASTAQ格式
分析軟件: 一系列商業軟件進行變異檢測,denovo組裝
優點: 無以倫比的快速,2個小時完成測序工作;Ion Torrent的化學測序原理自然簡單,無修飾的核苷酸、無激光器或光學檢測設備,因而可達到極小的測序偏差和出色的測序覆蓋均衡度。
缺點: 測序通量目前還不夠大,增加半導體芯片的容量將有望提高測序儀的處理能力。
經典案例: 1德國大腸桿菌疫情爆發之后,華大基因利用第三代測序儀——Ion
Torrent進行了該大腸桿菌的全基因組測序。在獲得病毒樣本后三天的時間內,華大基因完成了對該新型大腸桿菌的基因組測序。經過初步信息分析,發現該菌株是一種新的兼具侵襲、產毒、腸出血等特征的大腸桿菌。
備注: 特別適合微生物基因組測序及擴增子重測序
MiSeq
企業: Illumina
推出時間: 2011年
主流型號: MiSeq Personal Sequencing System(2011年)
樣品要求: 使用Nextera,50 ng DNA;使用TruSeq,100 ng–1 μg DNA
測序原理: 邊合成邊測序
這種測序技術通過將基因組DNA的隨機片斷附著到光學透明的表面,這些DNA片斷通過延長和橋梁擴增,形成了具有數以億計cluster的Flowcell,每個cluster具有約1000拷貝的相同DNA模板,然后用4種末端被封閉的不同熒光標記的堿基進行邊合成邊測序。這種新方法確保了高精確度和真實的一個堿基接一個堿基的測序,排除了序列方面的特殊錯誤,能夠測序同聚物和重復序列。
文庫制備: Fragment
模板制備: 橋式擴增
讀長:
1*35 bp
2*100 bp
2*150 bp
測序通量:
1*35 bp >120 Mb/run
2*100 bp >680 Mb/run
2*150 bp >1 Gb/run
時間/run:
擴增測序總時間:
1*35 bp 4 hours
2*100 bp 19 hours
2*150 bp 27 hours
堿基精確度:
>90% bases higher than Q30 at 1*35 bp
>80% bases higher than Q30 at 2*100 bp
>75% bases higher than Q30 at 2*150 bp
變異檢測能力(DNA重測序方面):
成本: N/A
數據格式: 儀器$125,000/臺,測序$750/run
分析軟件: *.bcl, FASTQ, BAM, *.vcf和*.csv.
優點: 樣品制備簡單快速,在一臺儀器上完成測序和數據處理;可靠的化學方法,可逆中止堿基邊測序邊合成法
缺點: N/A
經典案例: N/A
備注: 特別適合擴增子測序、克隆檢查和小基因組測序