大家好,我是飛哥,這一段時間,一直學習GCTA這個軟件,學習的過程中就進行了記錄和分享。奈何這款軟件還是太小眾,閱讀量不斷的降低,不過寫的過程是總結的過程,對我自己學習掌握很有幫助。
有朋友告訴我說,我的公眾號越來越沒有意思了,忘記了初心!所謂的初心就是寫段子!
段子好久沒寫了,老是分享知識太沉重了。所以,我決定,不能像一個工具人一樣,雖然要有工具人的技能,但是更要有哲學家的思想,有文學家的情感,有歷史學家的深思,有娛樂人的八卦。公眾號就要展示精彩,指導生活過得更精彩。
舊的結束,也是新的開始。讓我們先結束此篇吧!
前面的幾節中,我們介紹了GCTA計算G矩陣,和單性狀遺傳力的計算,它本質上就是GBLUP的估計,但是速度快很多。本節我們介紹,兩性狀遺傳力和遺傳相關的計算。
這部分,是使用reml的方法進行估計方差組分。默認的是AI算法,可以使用EM算法。
--reml-alg 0 # AI算法,默認算法 --reml-alg 1 # EM算法
指定GRM矩陣
--grm # 接二進制文件GRM的前綴 --grm-bin # 同上 --grm-gz # 接文本的GRM文件前綴
推薦使用二進制的文件,因為速度快,暫用空間少。
這是接因子協變量的,第一列和第二列分別是FID和IID,后面接因子協變量,比如場年季
接的是數字協變量,比如PCA,比如初生重等
接的是表型數據,格式也是plink的格式,第一列FID,第二列IID,第三列是表型數據(缺失用NA表示),第四列是表型數據
三列,第一列是FID,第二列IID,第三列是表型數據y,沒有行頭,空格隔開。
plink的二進制文件
這里,示例數據中,沒有提供協變量信息。如果提供,可以按照第一列是FID,第二列是IID,其它是協變量的方法整理數據。協變量分為數字協變量和因子協變量,要分開整理。
「使用Van
的方法」
這里,用Van
的方法,類似我們GBLUP估計所用的矩陣構建形式。
gcta64 --bfile ../test --make-grm --make-grm-alg 1 --out g2
結果文件:
這里,已經構建好了GRM矩陣,指定表型數據,進行遺傳力的估計
gcta64 --reml-bivar 1 2 --pheno ../nn_pheno.txt --grm ../grm/g1 --threads 30 --out re1
結果可以看出:
第一個性狀,遺傳力為0.47,標準誤是0.02 第二個性狀,遺傳力為0.16,標準誤為0.03 遺傳相關為:-0.22,標準誤為0.094
「使用ASReml作為對比」
「方差組分和遺傳力結果:」
可以看出,結果完全一樣。
「多性狀GCTA不支持的部分:」
?By default, GCTA will take the first two traits in the phenotype file for analysis. The phenotype file is specified by the option --pheno as described in univariate REML analysis. All the options for univariate REML analysis are still valid here except --mpheno, --gxe, --prevalence, --reml-lrt, --reml-no-lrt and --blup-snp. All the input files are in the same format as in univariate REML analysis.?
GCTA只能分析兩性狀的GBLUP遺傳評估,計算遺傳力和遺傳相關,速度很快。
「相對于ASReml軟件,缺點如下:」
相關系列閱讀:
第一篇:GCTA學習1 | 拋磚引玉--初步介紹
第二篇:GCTA學習2 | 軟件下載安裝--windows和Linux
第三篇:GCTA學習3 | 兩篇NG:fast-LMM和fast-GLMM
第四篇:GCTA學習4 | GCTA說明文檔--功能分類及常見問題
第五篇:GCTA學習5 | 計算PCA及可視化
第六篇:GCTA學習6 | 計算GRM矩陣(G矩陣)
第六篇:GCTA學習7 | 計算單性狀遺傳力和標準誤
本文由 貴州做網站公司 整理發布,部分圖文來源于互聯網,如有侵權,請聯系我們刪除,謝謝!
網絡推廣與網站優化公司(網絡優化與推廣專家)作為數字營銷領域的核心服務提供方,其價值在于通過技術手段與策略規劃幫助企業提升線上曝光度、用戶轉化率及品牌影響力。這...
在當今數字化時代,公司網站已成為企業展示形象、傳遞信息和開展業務的重要平臺。然而,對于許多公司來說,網站建設的價格是一個關鍵考量因素。本文將圍繞“公司網站建設價...
在當今的數字化時代,企業網站已成為企業展示形象、吸引客戶和開展業務的重要平臺。然而,對于許多中小企業來說,高昂的網站建設費用可能會成為其發展的瓶頸。幸運的是,隨...
保定東站到深圳多長時間?保定東站應該是高鐵站,所以從保定東站到深圳北高鐵站需要九個小時三十分鐘。北京到深圳的高鐵經過河北、河南、湖北、湖南、廣東。如果是快車,到深圳要25個小時。所以高鐵時代為大家節省了大量的時間,提高了工作效率,為的發展點贊 美國鐵路行業。保定東站到深圳多長時間? 71次,保定東-深圳北用時9小時23分;D927,保定東-深圳北用時10小時13分。(以上情況下,D927次列車為動...
nba球衣分哪幾種?NBA球衣分為五個等級:rep sw au gi gu從低到高。NBA球衣復刻版俗稱球衣復刻版,Replica簡稱REP,意思是球衣的膠印版。球衣上用橡皮印上球隊logo、球員姓名和號碼,采用膠印版球衣的所有細節。Swingman,簡稱SW,是一種球迷穿的足球球衣,風格和球員穿的一樣。運動衫是網眼的,單層的,號碼。簡稱Authentic,是面向球迷的高端球衣版本,與場上...
世界二十大名表?世界十大名表勞力士到世界十大名表品牌,分別是百達翡麗、寶璣、寶珀、江詩丹頓、伯爵、積家、芝柏。排名不分先后。0-@qq.com世界十大名表勞力士到世界十大名表品牌,分別是百達翡麗、愛馬仕、寶珀、VacheronConstantin、伯爵、積家和芝柏。排名不分先后。世界上最昂貴的十大奢侈品?你知道世界上十大最昂貴的奢侈品是什么嗎?《郵報》評選出十大奢侈品。所選的奢侈品既不是瑪莎拉蒂、...