1 讀入數據集
# 導入數據
setwd("C:\\Users\\****\\Documents\\ML\\day3\\")dataset=read.csv('50_Startups.csv')head(dataset)R.D.SpendAdministrationMarketing.SpendStateProfit1165349.2136897.80471784.1NewYork192261.82162597.7151377.59443898.5California191792.13153441.5101145.55407934.5Florida191050.44144372.4118671.85383199.6NewYork182902.05142107.391391.77366168.4Florida166187.96131876.999814.71362861.4NewYork156991.1
2 數據預處理
#虛擬變量dataset$State=factor(dataset$State,levels=c('NewYork','California','Florida'),labels=c(1,2,3))
3 訓練集和測試集
將數據按照4:1拆分,每一組分別包含自變量和因變量
#install.packages('caTools')library(caTools)set.seed(123)split=sample.split(dataset$Profit,SplitRatio=0.8)training_set=subset(dataset,split==TRUE)#多自變量test_set=subset(dataset,split==FALSE)#單因變量dim(training_set)[1]405dim(test_set)[1]105
4 模型擬合及預測
通過訓練集進行模型擬合得到曲線,然后將測試集的X_test帶入曲線中,得到預測結果y_pred,最后將預測結果y_pred與測試集中的y_test進行比較,確定預測是否準確。
4.1 多重線性回歸
regres=lm(formula=Profit~R.D.Spend+Administration+Marketing.Spend+State,data=training_set)summary(regres)Coefficients:EstimateStd.ErrortvaluePr(>|t|)(Intercept)4.965e+047.637e+036.5011.94e-07***R.D.Spend7.986e-015.604e-0214.2516.70e-16***Administration-2.942e-025.828e-02-0.5050.617Marketing.Spend3.268e-022.127e-021.5370.134State21.213e+023.751e+030.0320.974State32.376e+024.127e+030.0580.954---Signif.codes:0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1
4.2 進行逐步回歸分析
regres.step<-step(regres)Step:AIC=735.89Profit~R.D.Spend+Marketing.SpendDfSumofSqRSSAIC<none>3.3627e+09735.89-Marketing.Spend13.1338e+083.6761e+09737.45-R.D.Spend12.3344e+102.6706e+10816.77regres2=lm(formula=Profit~R.D.Spend+Marketing.Spend,data=training_set)
4.3 預測結果
y_pred=predict(regres2,newdata=test_set)y_pred4581116202124173687.21171299.96160499.08134783.16145873.04114467.75117025.30110369.71313298447.3997668.22test_set$Profit[1]182901.99166187.94155752.60146121.95129917.04122776.86118474.03108733.99[9]99937.5997483.56
4.4 結果可視化
plot(test_set$Profit,col="red")points(y_pred,col="blue")
“R語言多元線性回歸實例分析”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注本站網站,小編將為大家輸出更多高質量的實用文章!
本文由 貴州做網站公司 整理發布,部分圖文來源于互聯網,如有侵權,請聯系我們刪除,謝謝!
c語言中正確的字符常量是用一對單引號將一個字符括起表示合法的字符常量。例如‘a’。數值包括整型、浮點型。整型可用十進制,八進制,十六進制。八進制前面要加0,后面...
2022年天津專場考試原定于3月19日舉行,受疫情影響確定延期,但目前延期后的考試時間推遲。 符合報名條件的考生,須在規定時間登錄招考資訊網(www.zha...
:喜歡聽,樂意看。指很受歡迎?!巴卣官Y料”喜聞樂見:[ xǐ wén lè jiàn ]詳細解釋1. 【解釋】:喜歡聽,樂意看。指很受歡迎。2. 【示例】:這是...
近期國際金價暴跌原因是什么?根據我們的分析,近期國際金價的大幅下跌,一是因為各國經濟基本面不同,各國貨幣政策不同,使得美元持續走強;而且由于原油的擴容和下跌,以及全球通脹率較低,這一切都給金價帶來了下行壓力。據了解,黃金正走向自2000年以來的首次連續年度下跌,因為美聯儲(Fed)結束了債券購買計劃,原油價格下跌,降低了購買黃金作為對沖通脹工具的需求。此外,由于上市交易所基金(ETF)黃金頭寸外流...
MLF操作什么意思?MLF中文意思是中期借貸便利,由中國人民銀行創設,設立時間是2014年9月。MLF是央行提供的一種中期基礎貨幣的貨幣政策工作,面向的對象主要是符合宏觀審慎管理要求的商業銀行與政策性銀行,開展方式是通過招標。MLF采取質押的發行方式,并且還要投標方提供國債、央行票據、政策性金融債等優質債券作為合格質押品。MLF的作用:MLF利率可以發揮中期政策利率的作用,通過對金融機構中期融資的...
光大銀行的優勢有哪些?光大銀行同行優勢(1)中國光大集團是直屬的超大型企業集團,在中國光大銀行與優質中高端客戶建立緊密合作關系方面發揮了積極作用;(2)光大銀行為中高端市場配備了一支高素質、經驗豐富的營銷團隊,一是光大銀行領導親自擔任營銷專員,直接與客戶溝通,取得了良好的效果;其次,光大銀行企業營銷團隊具有高學歷、年輕化的特點,能夠有效捕捉客戶需求,設計有針對性的服務方案,積極進取,敢于拼搏,通過...