spass線性回歸
回歸分析是一種應用很廣的數量分析方法,用於分析事物間的統計關係,側重數量關係變化。回歸分析在數據分析中佔有比較重要的位置。
一元線性回歸模型:指只有一個解釋變數的線性回歸模型,用來揭示被解釋變數與另一個解釋變數的線性關係。
多元線性回歸模型:指含有多個揭示變數的線性回歸模型,用來揭示被解釋變數與多個解釋變數的線性關係。
此篇文章主要講述多元線性回歸分析。
方法/步驟-
線性回歸分析的內容比較多,比如回歸方程的擬合優度檢驗、回歸方程的顯著性檢驗、回歸係數的顯著性檢驗、殘差分析、變數的篩選問題、變數的多重共線性問題。
-
操作見圖。回歸分析通常需要多次試驗操作才可以得出較好的模型。「方法」中選擇「進入」,表示所有的自變數都進入模型,目前還沒有考慮到變數的多重共線問題,要先觀察初步的結果分析,才會考慮發哦變數的多重共線問題。
-
通過觀察調整後的判定係數0.924,擬合優度較高,不被解釋的變數較少。
由回歸方程顯著性檢驗的概率為0,小於顯著性水平0.05,則認為係數不同時為0,被解釋變數與解釋變數全體的線性關係是顯著的,可建立線性方程。
由係數表知,觀察回歸係數顯著性檢驗中的概率值,如果顯著性水平為0.05,除去「投入人年數」外,其他變數均大於顯著性水平,這些變數保留在方程中是不正確的。所以該模型不可用,應重新建模。
-
重新建模操作見圖片,採用的是「向後篩選」方法,依次剔除的變數是專著數、投入高級職稱的人年數、投入科研事業費、獲獎數、論文數。最後的模型結果是「立項課題數=-94.524+0.492x投入人年數」。
-
殘差分析:
又P-P圖可知,原始數據與正態分布的不存在顯著的差異,殘差滿足線性模型的前提要求。
由庫克距離(0.041小於1)和槓桿指變數的值知,沒有顯著的差異。
殘差點在0線周圍隨機分布。
推薦閱讀:
