服務(wù)介紹 Service Introduction
基因組de novo 測(cè)序,即基因組從頭測(cè)序,是指不依賴(lài)已知的基因組序列信息,對(duì)某個(gè)物種的全基因組序列進(jìn)行測(cè)序,然后利用生 物信息學(xué)手段對(duì)測(cè)序序列進(jìn)行拼接、組裝,從而獲得該物種的全基因組序列圖譜。全基因組序列圖譜的構(gòu)建將全面加深對(duì)該物種起源進(jìn)化 以及對(duì)特定環(huán)境適應(yīng)性過(guò)程的理解,為今后在該物種內(nèi)發(fā)現(xiàn)新基因以及物種改良起到巨大的作用,為基因組學(xué)研究搭建一個(gè)高效的平臺(tái); 為后續(xù)的基因挖掘、功能驗(yàn)證提供 DNA 序列信息。
通過(guò)漫長(zhǎng)的物種形成和進(jìn)化,不同的物種基因組的雜合度和基因組上的重復(fù)區(qū)域不盡相同。一般雜合度不超過(guò) 0.5%、重復(fù)序列含量 不超過(guò) 50%、GC 含量為 35% 到 65% 之間的單倍體或二倍體動(dòng)植物基因組定義為簡(jiǎn)單基因組。而動(dòng)植物復(fù)雜基因組是指 GC 含量小于 35% 或大于 65%,重復(fù)序列高于 50% 或雜合率大于 0.5% 的二倍體或多倍體的動(dòng)植物基因組。
利用 illumina 測(cè)序技術(shù),構(gòu)建插入片段大小為 180 bp、300 bp、500 bp、2 kb、5 kb、10 kb、20 kb 等大小不同的測(cè)序文庫(kù), 進(jìn)行 125 bp/150 bp/250 bp 的雙末端測(cè)序。其中插入片段長(zhǎng)度超過(guò) 1 kb 的文庫(kù)稱(chēng)之為 mate-pair 文庫(kù),長(zhǎng)片段文庫(kù)的構(gòu)建便于基因組 組裝過(guò)程中的重復(fù)序列定位。當(dāng)測(cè)序的總體深度達(dá)到 70× 以上時(shí),即可保證基因組拼接所需數(shù)據(jù)及序列中單堿基的準(zhǔn)確性。
技術(shù)流程 Technical Procedures
提供的服務(wù) Services
基因組調(diào)查:評(píng)估基因組的 GC 含量、重復(fù)度、雜合度,并估計(jì)基因組的大小。
基因組拼接統(tǒng)計(jì):拼接統(tǒng)計(jì),包括原始數(shù)據(jù)統(tǒng)計(jì)、測(cè)序深度、Contig N50、Scaffold N50、基因組 GC 含量等。
基因組注釋及基因功能分類(lèi):包括基因預(yù)測(cè)、功能注釋、ncRNA 注釋、重復(fù)序列分析以及 GO 分類(lèi)、KEGG 通路分析。
比較基因組及進(jìn)化分析:核苷酸水平共線性分析,氨基酸水平共線性分析,基因簇分析以及進(jìn)化關(guān)系。
組裝評(píng)估標(biāo)準(zhǔn) Assembly Evaluation Standard
樣品要求 Sample Requirements
實(shí)驗(yàn)類(lèi)型 | DNA樣品總量 | 樣品濃度和純度 | 樣品保存 | 樣品質(zhì)量 |
動(dòng)植物基因組de novo 測(cè)序 | 小片段文庫(kù)樣本制備需要總量大于 1 μg 的樣品,mate-pair 文庫(kù)(2 kb、5 kb、10 kb、)樣品,制備需要總量 20-50 μg | 樣品濃度 >200 ng/μl,OD260/280 介于 1.8-2.0 之間,無(wú)蛋白質(zhì)、RNA 或者肉眼可見(jiàn)雜質(zhì)污染 | 請(qǐng)保存于干粉、酒精、TE buffer 或超純水中,并請(qǐng)?jiān)跇悠沸畔沃凶⒚?/span> | 基因組完整、無(wú)降解,電泳結(jié)果基因組 DNA 主帶應(yīng)在入 -Hind llldigest 最大條帶 23 KB 以上且主帶清晰,無(wú)彌散 |