k-NN (k nearest neighbor)
(用得比较少)
算法思想
- 近朱者赤,近墨者黑.
- 选择k个邻居(自带特征)对其"投票",决定是哪一类.
问题
如何选择邻居 --- 距离(特征间距离)?
- 欧氏距离
如何选择K 的大小?
- k - 是hyperparameter ,人为设定,不是由算法学习得到的参数.
- k 过小-underfitting ; k 过大 - overfitting
Input
- 数值型和标称型
- 数值型要注意归一化 ()
Output
适用场景
优点
缺点