目录
- P22
P22
复习一下:
假设同类别之间的数据是比较相似的,所以在空间里,同类别的数据是挨在一起的。那么假设现在有一个超平面去进行二分类,由于一个类别的数量多得多而且两个类别的权重是一样的,于是超平面就可以把很多少数类分为正数类而且损失函数的值要下降(看P12,假设正类是多数类,负类是少数类,那么随着超平面把越来越多的负类分为正类,由于正类与正类之间挨得很紧,所以绝大部分正类的置信度在上升,也就是他们的\(p_1\)在上升,而负类的\(p_0\)在下降,但是由于正类的个数要多的多,导致损失函数\(l(\vec{w},b)\)仍然在上升)
为了避免这一点,我们的直觉就是要加重少数类的权重,让分错一个少数类的惩罚更大,所以就有了PPT的操作