SVM預測模型

支持向量機回歸的主要思想是通過一個非線性映射Φ,將數據x映射到高位特徵空間F,並在這個空間進行線性回歸。

模型1:建立軋鋼機狀態監測數據與軋制鋼板「表面粗糙度」間的SVM預測模型

模型2:建立軋鋼機狀態監測數據與軋制鋼板「厚度誤差」間的SVM預測模型

解釋變數:X1-X6

模型1被解釋變數:Y1(表面粗糙度)

模型2被解釋變數:Y2(厚度誤差)

支持向量機預測模型的評價標準

支持向量機預測模型預測效果可以採用平均絕對百分比誤差(MAPE)和平均絕對誤差(MAE)來評價,MAPE和MAE的表達式如下:

  • 數據歸一化(為了減少數值變化範圍,加快計算速度)

將特徵值從一個大範圍映射到【-1,1】

  • 所選核函數為高斯核函數:

  • 交叉驗證(CV)方式選擇:

K-fold Cross validatin(K-CV):分為K組,(本文K=4),將每組子集分別做一次訓練集,其餘K-1組子集數據作為驗證集

C和g的值是在以2為底的[-8,8]上取值,即C和g的值是在[2^-8,2^8]取值,v為4(給測試集分為4部分進行 Cross validatin),取最終測試集數據和預測集數據誤差最小的C和g。

再進行精細選擇:精細選擇c和g範圍:[2^-4,2^4]

  • 得到最佳c&g

模型1:c=2.8284,g=11.3137

模型2:c=0.35355,g=4

  • 模型1&2預測結果

模型1:100個預測值選取10個結果如下:

MAPE = 3.81089%

MAE = 1.35221

均方誤差 MSE = 0.0173719

相關係數 R = 82.0105%

從預測效果上看,SVM 能夠達到預測的要求,並且有較高的預測精度。

模型2:100個預測值選取20個結果如下:

這段預測還較為理想:

可是接下來...:

均方誤差 MSE = 0.0667926

相關係數 R = 65.6942%

MAPE = 19.6881

MAE = 81.9823

該預測結果就難以達到檢驗的標準,並不理想。

提高預測精度確實是一個非常困難的過程。

感謝隊友的辛苦工作 愛你們


推薦閱讀:

分類及離散度量指標
目標檢測(5)-Faster RCNN
機器學習——字典學習/稀疏編碼學習筆記

TAG:数学建模 | 机器学习 | 数据分析 |