机器学习算法(二): 朴素贝叶斯(Naive Bayes)
贝叶斯:计算条件概率
p(A,B):表示事件A和事件B同时发生的概率。
p(B):表示事件B发生的概率,叫做先验概率;p(A):表示事件A发生的概率。
p(A|B):表示当事件B发生的条件下,事件A发生的概率叫做后验概率。
p(B|A):表示当事件A发生的条件下,事件B发生的概率。
在贝叶斯中对于离散特征
朴素贝叶斯:所有特征出现互相独立互不影响。每一特征同等重要。
朴素贝叶斯法 = 贝叶斯定理 + 特征条件独立。
高斯朴素贝叶斯:每个特征都是连续的,并且都呈高斯分布。
读程序:
1、import warnings
warnings.filterwarnings(‘ignore’):忽略警告信息
2、naive_bayes:朴素贝叶斯。高斯朴素贝叶斯(GaussianNB)
3、train_test_split:划分数据集
4、var_smoothing进行拉普拉斯平滑,方便有效的避免零概率问题
5、shuffle()函数是打乱序列里面的元素,并随机排列的。