Plant Phenomics | GenoDrawing:用于SNP的圖像預測自動編碼框架
高通量基因組測序和基因分型方法的進步,使許多植物物種(包括模型和作物)的全基因組鑒定以及種群水平的多樣性分析成為現實。在這種海量基因型數據的情況下,作物基因型和表型之間的聯系具有巨大的潛力,可以識別與相關農業性狀自然變異有關的基因或基因組區域,并預測后代在特定環境中的表現。但由多個數量性狀位點調控的復雜數量性狀,由于其效應較小,用較少的標記難以預測。而利用深度學習和神經網絡進行基因組預測,有望克服傳統方法中的一些挑戰。
2023年11月,Plant Phenomics在線發表了西班牙Center for Research in Agricultural Genomics (CRAG)單位Federico Jurado-Ruiz 和 Maria José Aranzana等人題為GenoDrawing: An Autoencoder Framework for Image Prediction from SNP Markers 的研究論文。
本研究引入了一種自動編碼器框架GenoDrawing,用于從低深度單核苷酸多態性(SNP)陣列中預測和檢索蘋果圖像,可能有助于預測難以定義的性狀。作者基于該框架,使用蘋果形狀相關的SNP預測其表型,結果顯示,使用與視覺性狀相關的SNPs會對生成的圖像產生顯著影響,與生物學解釋一致。另外,使用大量相關的SNPs能提升性能,但加入不相關的SNPs會導致性能下降。
圖1 圖形摘要。(1)將蘋果基因型數據集分為訓練和驗證兩個子集,每個子集保留了蘋果整體形狀分布。(2) SNP基因型矩陣分為2個,每個數據集1個。(3和4)使用訓練數據集中的圖像來擬合自動編碼器模型。(5和6)每張圖像(64個嵌入)的編碼值按基因型平均,并與SNP矩陣一起用于訓練嵌入預測模型。(7) GenoDrawing的結果不是一個訓練模型,而是一個自動編碼器、解碼器和嵌入預測器的集合。(8) GenoDrawing預測的圖像示例。
圖2 (左)蘋果原始圖像。(右)蘋果預測圖像。
總的來說,盡管GenoDrawing存在一定的局限性,但其為未來基于基因組標記的圖像預測研究奠定了基礎。另外,該框架被證實可用于果樹表型預測研究,可用于預測相關的遺傳性狀。
作者介紹
本文的主要作者為Federico Jurado-Ruiz和Maria José Aranzana,所屬單位為西班牙農業基因組學研究中心和農業食品技術研究所。該工作由Federico Jurado-Ruiz和Maria José Aranzana構思和設計;Federico Jurado-Ruiz進行實驗;Federico Jurado-Ruiz和Maria José Aranzana完成手稿。
論文鏈接:
https://spj.science.org/doi/10.34133/plantphenomics.0113
——推薦閱讀——
https://doi.org/10.34133/plantphenomics.0127
Plant Phenomics | 華盛頓大學基于時間序列圖像表型與植物功能結構模型相結合預測不定根構型
https://spj.science.org/doi/10.34133/plantphenomics.0146
Plant Phenomics | 東京大學利用高光譜圖像預測番茄葉片中元素含量的多目標回歸方法
加入作者交流群
掃碼添加小編微信,拉您進入《植物表型組學》作者交流群,群內不定期開展作者分享會、專刊發布會等高質量活動。
添加小編微信,備注姓名+單位+PP,加入作者交流群
About Plant Phenomics
《植物表型組學》(Plant Phenomics)是由南京農業大學和美國科學促進會(AAAS)合作創辦的英文學術期刊,于2019年1月正式上線發行。采用開放獲取形式,刊載植物表型組學交叉學科熱點領域具有突破性科研進展的原創性研究論文、綜述、數據集和觀點。具體范圍涵蓋高通量表型分析的最新技術,基于圖像分析和機器學習的表型分析研究,提取表型信息的新算法,作物栽培、植物育種和農業實踐中的表型組學新應用,與植物表型相結合的分子生物學、植物生理學、統計學、作物模型和其他組學研究,表型組學相關的植物生物學等。期刊已被DOAJ、Scopus、PMC、EI和SCIE等數據庫收錄。科睿唯安JCR2022影響因子為6.5,位于農藝學、植物科學、遙感一區。2023年中科院期刊分區位于農林科學大類一區。2020年入選中國科技期刊卓越行動計劃高起點新刊項目。
說明:本文由《植物表型組學》編輯部負責組稿。
中文內容僅供參考,一切內容以英文原版為準。
排版:李芯蕊(南京農業大學)
審核:孔敏、王平