BAT機器學習面試1000題系列(211-215)
01-29
211.解決隱馬模型中預測問題的演算法是?
A.前向演算法
B.後向演算法C.Baum-Welch演算法
D.維特比演算法正確答案:D
@劉炫320,本題題目及解析來源:http://blog.csdn.net/column/details/16442.htmlA、B:前向、後向演算法解決的是一個評估問題,即給定一個模型,求某特定觀測序列的概率,用於評估該序列最匹配的模型。
C:Baum-Welch演算法解決的是一個模型訓練問題,即參數估計,是一種無監督的訓練方法,主要通過EM迭代實現; D:維特比演算法解決的是給定 一個模型和某個特定的輸出序列,求最可能產生這個輸出的狀態序列。如通過海藻變化(輸出序列)來觀測天氣(狀態序列),是預測問題,通信中的解碼問題。212.一般,k-NN最近鄰方法在( )的情況下效果較好
A.樣本較多但典型性不好
B.樣本較少但典型性好
C.樣本呈團狀分布 D.樣本呈鏈狀分布正確答案:B
解析:K近鄰演算法主要依靠的是周圍的點,因此如果樣本過多,那肯定是區分不出來的。因此應當選擇B樣本呈團狀頗有迷惑性,這裡應該指的是整個樣本都是呈團狀分布,這樣kNN就發揮不出其求近鄰的優勢了,整體樣本應該具有典型性好,樣本較少,比較適宜。
213.下列方法中,可以用於特徵降維的方法包括()
A.主成分分析PCA
B.線性判別分析LDAC.深度學習SparseAutoEncoder
D.矩陣奇異值分解SVD E.最小二乘法LeastSquares正確答案:ABCD
解析:降維的3種常見方法ABD,都是線性的。深度學習是降維的方法這個就比較新鮮了,事實上,細細想來,也是降維的一種方法,因為如果隱藏層中的神經元數目要小於輸入層,那就達到了降維,但如果隱藏層中的神經元如果多餘輸入層,那就不是降維了。最小二乘法是線性回歸的一種解決方法,其實也是投影,但是並沒有進行降維。214.下面哪些是基於核的機器學習演算法?()
A.Expectation Maximization(EM)(最大期望演算法)
B.Radial Basis Function(RBF)(徑向基核函數) C.Linear Discrimimate Analysis(LDA)(主成分分析法) D.Support Vector Machine(SVM)(支持向量機)正確答案:BCD
解析:徑向基核函數是非常常用的核函數,而主成分分析法的常規方法是線性的,但是當遇到非線性的時候,同樣可以使用核方法使得非線性問題轉化為線性問題。支持向量機處理非線性的問題的時候,核函數也是非常重要的。215.試推導樣本空間中任意點x到超平面(w,b)的距離公式。

推薦閱讀:
