Discriminative VS Generative
- Discriminative models 判别模型
直接建模P(c|x) - Generative models 生成模型
P(c|x) = P(x, c) / P(x) = P(c)*P(x|c)/P(x)
其中,- P(c)可以通过统计各类样本比例频率来估计 –频率学派
- P(x|c)因为样本x的数据量太小,很难估计准确
频率学派 VS 贝叶斯学派
- Frequentist 频率学派
参数是一个未知但客观存在的固定值 - Bayesian 贝叶斯学派
参数本身是一个分布
Naive Bayes
- 属性条件独立性假设(假设每个属性独立地对分类结果发生影响)
- Smoothing: 拉普拉斯修正(Laplacian Correction)
- Lazy Learning
semi-naive Bayes classifier
todo