1. <nobr id="easjo"><address id="easjo"></address></nobr>

      <track id="easjo"><source id="easjo"></source></track>
      1. 
        

      2. <bdo id="easjo"><optgroup id="easjo"></optgroup></bdo>
      3. <track id="easjo"><source id="easjo"><em id="easjo"></em></source></track><option id="easjo"><span id="easjo"><em id="easjo"></em></span></option>
          貴州做網站公司
          貴州做網站公司~專業!靠譜!
          10年網站模板開發經驗,熟悉國內外開源網站程序,包括DEDECMS,WordPress,ZBlog,Discuz! 等網站程序,可為您提供網站建設,網站克隆,仿站,網頁設計,網站制作,網站推廣優化等服務。我們專注高端營銷型網站,企業官網,集團官網,自適應網站,手機網站,網絡營銷,網站優化,網站服務器環境搭建以及托管運維等。為客戶提供一站式網站解決方案?。?!

          大數據分析案例(r語言線性回歸實例分析)

          來源:互聯網轉載 時間:2024-05-02 16:25:01

          回歸分析是一種廣泛使用的統計工具,利用已有的實驗數據,通過一個方程來定量的描述變量之間的關系,其中的變量可以分為兩類

          1. 自變量,也稱之為預測變量

          2. 因變量,也稱之為響應變量

          自變量可以有多個,而因變量只有一個,回歸的本質就是構建因變量和自變量之間的方程?;貧w分析有兩個經典的用法,第一個就是建模預測,通過構建的回歸方程來對新的數據集進行預測,第二個就是用于定量描述變量間的相關性,在GWAS中,就是利用了回歸分析的這一用法,本文首先來看下線性回歸。

          顧名思義,線性回歸用線性方程來描述變量之間的關系,根據自變量的個數,又可以劃分為一元線性回歸和多元線性回歸。這里的一元和多元指的就是自變量的個數。以一元線性回歸為例,其方程如下

          y = ax + b + c

          其中x是自變量,y是因變量,a稱之為回歸系數,b稱之為回歸常數. c稱之為誤差,也叫做殘差,a和b合稱為回歸參數,線性回歸的目的就是求解回歸參數。以探討身高和體重間的線性關系為例,數據如下

          其分布如下所示

          從圖上可以直觀的感覺到,二者是一個線性關系,線性回歸的本質就是根據實際的數據來擬合出一條最佳的直線,這里的最佳非常的重要,對于相同的數據,可以擬合出多條直線,示意如下

          圖中兩條直線的效果看著差不多,那么如何來定量的比較不同直線的擬合效果,從而選擇最優的呢?

          通常有兩種方法,第一種稱之為最小二乘法,利用實際值和擬合值之間的差值,也就是殘差值來構建衡量擬合效果的統計量,圖示如下


          圖中的散點是實際觀測值,直線上為擬合值,實際觀測值和擬合值之間的線段代表的就是殘差。對應的統計量為殘差平方和,英文如下

          residual sum of squares (RSS)
          sum of squared estimate of errors (SSE)
          sum of squared residuals (SSR)

          計算公式如下

          可以看做是一個歐式距離的求解,最小二乘法將殘差平方和最小的直線作為最佳直線。第二種稱之為最大似然法,似然其實就是概率,對于擬合出的直線,計算實際觀測值出現的概率,將這個概率值作為擬合效果的標記量,概率最大的直線就認為擬合效果最佳。

          其中,最小二乘法可以看做是最大似然的一個特例,可以由最大似然推導出來,在簡單的線性回歸中,最小二乘法應用廣泛。以R語言為例,進行一元線性回歸的代碼如下

          其中intercept稱之為截距,對應回歸方程中的回歸常數,對于height這個自變量,其回歸系數為0.6746。這里我們直接得到了最終的回歸參數,其實在這里還有很多的細節,通過summary可以進行查看

          第一個是殘差的分布情況,用五個數字來表示,分別是最小值,第一四分位數,中位數,第三四分位數,最大值。在R中,可以通過quantile這個函數來進行計算

          第二個是對回歸參數的檢驗,通過t檢驗來分析回歸方程中每個變量和因變量之間的相關性,對應Pr(>|t|)的部分, p值小于0.01認為是相關的。

          第三個殘差標準誤,residual standard error, 標準誤是衡量總體離散程度的統計量,計算公式如下

          殘差平方和除以自由度再開根號即可得到殘差標準誤,所以最佳的擬合直線其對應的殘差標準誤的值應該也是最小的。

          第四個是R2,R-squared, 計算公式如下

          SST是實際觀測值的方差,SSR是擬合值的方差,R2為擬合值的方差占實際觀測值方差的比例,取值范圍為0-1。R2也稱之為擬合優度,數值越接近1,說明擬合效果越好。對于一個回歸方程的解而言,其差標準誤和R2值是確定的,對于最佳的擬合直線而言,其殘差標準誤一定是最小,R2值一定是最大。

          R2除了表征擬合效果外,還有一個用途,那就是表征自變量和因變量相關性的大小,只適用于一元線性回歸,此時R2的值為自變量x和因變量y的相關系數的平方,所以在單位點的關聯分析中,可以根據R2的值篩選相關性強的位點。

          這里還有一個校正之后的R2, 計算公式如下

          最后一個是整體方程的顯著性檢驗,通過F檢驗來判斷顯著性。在GWAS中,利用線性回歸可以分析SNP位點和連續型的表型性狀之間的關聯,利用pvalue來確定顯著關聯的位點,進一步可以根據R2來篩選關聯性強的snp位點。

          到此,相信大家對“r語言線性回歸實例分析”有了更深的了解,不妨來實際操作一番吧!這里是本站網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續學習!

          c語言中正確的字符常量是用一對單引號將一個字符括起表示合法的字符常量。例如‘a’。數值包括整型、浮點型。整型可用十進制,八進制,十六進制。八進制前面要加0,后面...

          2022年天津專場考試原定于3月19日舉行,受疫情影響確定延期,但目前延期后的考試時間推遲。 符合報名條件的考生,須在規定時間登錄招考資訊網(www.zha...

          :喜歡聽,樂意看。指很受歡迎?!巴卣官Y料”喜聞樂見:[ xǐ wén lè jiàn ]詳細解釋1. 【解釋】:喜歡聽,樂意看。指很受歡迎。2. 【示例】:這是...

          期貨貼水做多還是做空?一般來說期貨貼水對市場期望來說利于做空,期貨貼水是在某個特定的時間地點內,某一個特定商品的期貨價格比現貨價格低,反之叫做期貨升水。但是期貨的貼水或升水,受到很多因素的影響,包括股市分紅、套利力量、市場情緒、市場利率、微觀資金成本等等,并環-定代表著定價有所偏差,因此并不是做多或者做空的唯一判斷標準,還需要結合很多因素來看。期貨貼水行情既可以指商品現貨與交割月份間的價格關系,也...

          優色林淡斑精華有用嗎優色林淡斑精華白天能用嗎?下面一起來了解下吧。優色林淡斑精華是很出名的一款產品,很多網友都在安利,李佳琦也不例外,據說這款產品淡斑美白效果很顯著。那么,優色林淡斑精華白天能用嗎?是不是真的那么好用?讓我們一起來看看吧!真的提亮膚色!一個星期左右膚色明顯變的很健康。鼻翼本來的泛紅有一點改善(不過不確定是不是這個精華的原因)。搓泥是有的,但比較輕微,一定不可以搭搓泥的面霜一起用。美...

          1、蘋果手機稱重功能使用教程2、打開手機設置,找到觸控選項。(資料圖片)3、 4、在touch中開啟三維觸摸和觸覺觸摸功能。5、 6、打開后進入瀏覽器搜索touchscale(點擊英文單詞直接進入)。7、 8、進入如下屏幕電子秤頁面。9、 10、這時候把物體放在手機上就可以稱重了。11、 12、注:由于該功能要求手機具備3dtouch功能,目前支持該功能的蘋果手機型號有:iPhone 6s、iPh...

          TOP
          国产初高中生视频在线观看|亚洲一区中文|久久亚洲欧美国产精品|黄色网站入口免费进人
          1. <nobr id="easjo"><address id="easjo"></address></nobr>

              <track id="easjo"><source id="easjo"></source></track>
              1. 
                

              2. <bdo id="easjo"><optgroup id="easjo"></optgroup></bdo>
              3. <track id="easjo"><source id="easjo"><em id="easjo"></em></source></track><option id="easjo"><span id="easjo"><em id="easjo"></em></span></option>