2月8日,華中農業大學生物信息團隊楊慶勇教授課題組在國際學術期刊Molecular Plant在線發表題為“BnVIR: bridging the genotype-phenotype gap to accelerate mining of candidate variations for traits in Brassica napus”的研究論文,該研究建立了甘藍型油菜基因型與基因表達、表型的關聯,為快速、高效地挖掘油菜候選變異/基因提供了平臺。
該研究首先構建了一套由2,311個甘藍型油菜核心種質鑒定的10,090,561個遺傳變異的數據集,其中包括SNP、InDel和不同種類的SV,這是目前已發表的最為系統、最為完整的甘藍型油菜遺傳變異集合。該研究以其中1,703個材料的18個性狀的表型數據和309個材料的RNA-seq數據為基礎,構建出甘藍型油菜變異信息資源數據庫BnVIR(http://yanglab.hzau.edu.cn/BnVIR)(圖1)。
圖1 BnVIR數據庫主頁、構建流程和概貌 該數據庫提供了群體水平的遺傳變異基因型與表型和基因表達量的關聯,可輔助快速挖掘與油菜性狀相關的候選變異和基因(圖2)。此外,該數據庫為甘藍型油菜種質資源的查詢、群體遺傳學和進化分析以及關聯分析等提供了多種工具。最后,該研究通過挖掘一些已報道的(如FLC.A10、FAE1.A08、FAE1.C03、FAD2.A05)和新鑒定的候選基因和功能變異的案例分析,以及獨立表型數據集的檢驗分析等系列工作,系統全面地展示了該數據平臺在挖掘與表型相關的候選變異和基因的潛力、可靠性與穩健性(圖3)。與現有甘藍型油菜數據庫不同,BnVIR提供了更加全面、更加豐富的變異及其與多個組學數據的關聯和更加友好和豐富的用戶界面,可顯著提高研究者挖掘候選變異和基因的效率,并為甘藍型油菜的分子育種開發提供有價值的標記。
圖2 使用BnVIR數據庫驗證/挖掘候選基因/變異的實例 遺傳變異是物種表型多樣性形成的物質基礎,包括單核苷酸多態性(SNP),小片段的插入/缺失(InDel)以及大規模結構變異(SV)。目前,遺傳變異已被廣泛應用于人類疾病、動植物重要農藝或經濟性狀相關遺傳位點的鑒定、重要功能基因的克隆、分子標記輔助選擇育種等工作。對于作物遺傳育種,準確了解遺傳變異對基因的調控效應以及與表型分化的關聯,對種質資源的精準鑒定和優異等位基因的挖掘具有重要作用。 油菜作為世界四大油料作物之一,在全球范圍內為人類的生活和生產提供優質的食用植物油和飼料蛋白來源。我國年均油菜生產和消費居世界首位,常年種植面積1億畝左右,占油料作物面積的50%以上,油菜安全生產在保障我國食用油供應和蛋白飼料需求上發揮著重要作用。近年來,經過一代又一代油菜科學家的努力,我國油菜研究實現了從理論、技術、產品到轉化的鏈式創新,推動了我國油菜基礎研究與應用步入世界第一方陣(《中國農業農村科技發展報告(2012—2017)》)。然而,當前我國油菜大多仍以常規育種與分子標記輔助選擇育種技術為主,與國外大規模應用的以基因組選擇為核心的分子育種技術相比,在品種育成速度、成功率及效率等方面仍有較大差距。因此,如何將基礎研究中長期積累的資源和多組學數據(基因組、轉錄組等)優勢轉化成育種優勢,是當前油菜遺傳育種的核心研究內容之一。 隨著后基因組代的到來,作物科學領域已積累海量數據,利用生物信息技術將大規模的多組學數據進行系統的整合和分析,并構建更友好的圖形化、可視化數據庫,將極大促進重要農藝性狀的功能基因的發掘及機制解析,推動優異種質資源的開發和利用,加快品種選育。這對發展高效、精準的新一代生物育種,打贏種業翻身仗具有重要意義。該研究不僅為甘藍型油菜今后的遺傳育種提供了重要平臺,也為其他作物進行整合和利用多組學數據推動育種產業發展提供重要參考。 我校信息學院楊慶勇教授為論文通訊作者,信息學院已畢業博士生楊植全(現廣州大學博士后)、博士研究生梁聰園和碩士研究生魏璐露為論文共同第一作者。我校作物遺傳改良國家重點實驗室周永明教授、郭亮教授對本研究提供了重要指導。該研究得到國家自然科學基金、國家重點研究發展計劃和中央高校基本科研業務費專項資金項目資助。 楊慶勇教授課題組近年來聚焦“油菜基因組學與分子育種”研究方向,先后與國內多個研究團隊合作,通過系統整合和分析甘藍型油菜的多組學數據,構建了首個油菜泛基因組(Nature Plants, 2020)及其數據庫BnPIR(Plant Biotechnology Journal, 2021)、油菜轉錄組數據庫BnTIR (Plant Biotechnology Journal, 2021)、油菜遺傳變異數據庫BnVIR(Molecular Plant, 2022)和植物遺傳變異參考面板數據庫Plant-ImputeDB (Nucleic Acids Research, 2021),搭建了我國自主可控的油菜參考基因組生態。目前在Molecular Plant、Nature Plants、Nucleic Acids Research、Plant Biotechnology Journal等雜志發表多篇油菜基因組和數據庫論文。 【英文摘要】 Genetic variations, which range from single nucleotide polymorphisms (SNPs) and short insertion/deletions (InDels) to large-scale structural variations (SVs), are the basis of phenotypic diversity. Understanding the effect of genetic variations on traits is critical for uncovering the genetic architecture of various phenotypes. In humans, great efforts have been made to catalog the huge amounts of variations in single locus and their functional and phenotypic impacts, as well as detect the genetic interactions between loci underlying complex diseases, which are of great significance for pathologic studies (Civelek and Lusis 2014; Karczewski et al., 2020; Li et al., 2013)。 In plants, the functional and phenotypic impacts of genetic variations remain largely unknown. As an important oil crop, Brassica napus (B. napus) provides high-quality vegetable oil and feed protein worldwide (Chalhoub et al., 2014)。 Substantial genotypic, transcriptomic and phenotypic data of B. napus have become available in public databases recently (Liu et al., 2021; Song et al., 2020; Yan et al., 2021), which provide important resources for molecular marker-assisted breeding and genetic improvement of B. napus. However, the mining of candidate variations/genes has been largely hindered by the lack of solid association between genotype and phenotype and the corresponding platform (Yan et al., 2021)。 Here, to bridge the gap between genotype and phenotype, we first constructed a large panel of genetic variations, and presented the most systematic and complete variations of B. napus, including SNPs, InDels and various SVs. Then, phenotype data from traits of 1,703 accessions and RNA-seq data of 309 accessions were used as a basis to assemble a B. napus variation information resource (BnVIR; http://yanglab.hzau.edu.cn/BnVIR)。 The database provides genotype-phenotype maps for rapid mining of candidate variations/genes associated with various traits in B. napus. Besides, it is the first platform for checking the genetic interactions between candidate loci or genes associated with quantitative traits. 論文鏈接:https://www.cell.com/molecular-plant/fulltext/S1674205222000508
圖1 BnVIR數據庫主頁、構建流程和概貌 該數據庫提供了群體水平的遺傳變異基因型與表型和基因表達量的關聯,可輔助快速挖掘與油菜性狀相關的候選變異和基因(圖2)。此外,該數據庫為甘藍型油菜種質資源的查詢、群體遺傳學和進化分析以及關聯分析等提供了多種工具。最后,該研究通過挖掘一些已報道的(如FLC.A10、FAE1.A08、FAE1.C03、FAD2.A05)和新鑒定的候選基因和功能變異的案例分析,以及獨立表型數據集的檢驗分析等系列工作,系統全面地展示了該數據平臺在挖掘與表型相關的候選變異和基因的潛力、可靠性與穩健性(圖3)。與現有甘藍型油菜數據庫不同,BnVIR提供了更加全面、更加豐富的變異及其與多個組學數據的關聯和更加友好和豐富的用戶界面,可顯著提高研究者挖掘候選變異和基因的效率,并為甘藍型油菜的分子育種開發提供有價值的標記。
圖2 使用BnVIR數據庫驗證/挖掘候選基因/變異的實例 遺傳變異是物種表型多樣性形成的物質基礎,包括單核苷酸多態性(SNP),小片段的插入/缺失(InDel)以及大規模結構變異(SV)。目前,遺傳變異已被廣泛應用于人類疾病、動植物重要農藝或經濟性狀相關遺傳位點的鑒定、重要功能基因的克隆、分子標記輔助選擇育種等工作。對于作物遺傳育種,準確了解遺傳變異對基因的調控效應以及與表型分化的關聯,對種質資源的精準鑒定和優異等位基因的挖掘具有重要作用。 油菜作為世界四大油料作物之一,在全球范圍內為人類的生活和生產提供優質的食用植物油和飼料蛋白來源。我國年均油菜生產和消費居世界首位,常年種植面積1億畝左右,占油料作物面積的50%以上,油菜安全生產在保障我國食用油供應和蛋白飼料需求上發揮著重要作用。近年來,經過一代又一代油菜科學家的努力,我國油菜研究實現了從理論、技術、產品到轉化的鏈式創新,推動了我國油菜基礎研究與應用步入世界第一方陣(《中國農業農村科技發展報告(2012—2017)》)。然而,當前我國油菜大多仍以常規育種與分子標記輔助選擇育種技術為主,與國外大規模應用的以基因組選擇為核心的分子育種技術相比,在品種育成速度、成功率及效率等方面仍有較大差距。因此,如何將基礎研究中長期積累的資源和多組學數據(基因組、轉錄組等)優勢轉化成育種優勢,是當前油菜遺傳育種的核心研究內容之一。 隨著后基因組代的到來,作物科學領域已積累海量數據,利用生物信息技術將大規模的多組學數據進行系統的整合和分析,并構建更友好的圖形化、可視化數據庫,將極大促進重要農藝性狀的功能基因的發掘及機制解析,推動優異種質資源的開發和利用,加快品種選育。這對發展高效、精準的新一代生物育種,打贏種業翻身仗具有重要意義。該研究不僅為甘藍型油菜今后的遺傳育種提供了重要平臺,也為其他作物進行整合和利用多組學數據推動育種產業發展提供重要參考。 我校信息學院楊慶勇教授為論文通訊作者,信息學院已畢業博士生楊植全(現廣州大學博士后)、博士研究生梁聰園和碩士研究生魏璐露為論文共同第一作者。我校作物遺傳改良國家重點實驗室周永明教授、郭亮教授對本研究提供了重要指導。該研究得到國家自然科學基金、國家重點研究發展計劃和中央高校基本科研業務費專項資金項目資助。 楊慶勇教授課題組近年來聚焦“油菜基因組學與分子育種”研究方向,先后與國內多個研究團隊合作,通過系統整合和分析甘藍型油菜的多組學數據,構建了首個油菜泛基因組(Nature Plants, 2020)及其數據庫BnPIR(Plant Biotechnology Journal, 2021)、油菜轉錄組數據庫BnTIR (Plant Biotechnology Journal, 2021)、油菜遺傳變異數據庫BnVIR(Molecular Plant, 2022)和植物遺傳變異參考面板數據庫Plant-ImputeDB (Nucleic Acids Research, 2021),搭建了我國自主可控的油菜參考基因組生態。目前在Molecular Plant、Nature Plants、Nucleic Acids Research、Plant Biotechnology Journal等雜志發表多篇油菜基因組和數據庫論文。 【英文摘要】 Genetic variations, which range from single nucleotide polymorphisms (SNPs) and short insertion/deletions (InDels) to large-scale structural variations (SVs), are the basis of phenotypic diversity. Understanding the effect of genetic variations on traits is critical for uncovering the genetic architecture of various phenotypes. In humans, great efforts have been made to catalog the huge amounts of variations in single locus and their functional and phenotypic impacts, as well as detect the genetic interactions between loci underlying complex diseases, which are of great significance for pathologic studies (Civelek and Lusis 2014; Karczewski et al., 2020; Li et al., 2013)。 In plants, the functional and phenotypic impacts of genetic variations remain largely unknown. As an important oil crop, Brassica napus (B. napus) provides high-quality vegetable oil and feed protein worldwide (Chalhoub et al., 2014)。 Substantial genotypic, transcriptomic and phenotypic data of B. napus have become available in public databases recently (Liu et al., 2021; Song et al., 2020; Yan et al., 2021), which provide important resources for molecular marker-assisted breeding and genetic improvement of B. napus. However, the mining of candidate variations/genes has been largely hindered by the lack of solid association between genotype and phenotype and the corresponding platform (Yan et al., 2021)。 Here, to bridge the gap between genotype and phenotype, we first constructed a large panel of genetic variations, and presented the most systematic and complete variations of B. napus, including SNPs, InDels and various SVs. Then, phenotype data from traits of 1,703 accessions and RNA-seq data of 309 accessions were used as a basis to assemble a B. napus variation information resource (BnVIR; http://yanglab.hzau.edu.cn/BnVIR)。 The database provides genotype-phenotype maps for rapid mining of candidate variations/genes associated with various traits in B. napus. Besides, it is the first platform for checking the genetic interactions between candidate loci or genes associated with quantitative traits. 論文鏈接:https://www.cell.com/molecular-plant/fulltext/S1674205222000508