我做了一些简单的贝叶斯分类
X = [[1,0,0], [1,1,0]] ### there are more data of course
Y = [1,0]
classifier = BernoulliNB()
classifier.fit(X, Y)
现在我有一些“内幕提示”,每个X中的第一个元素比其他元素更重要.
>我可以在培训模型之前加入这些知识吗?
>如果sklearn不允许,是否有其他分类器或其他图书馆允许我们在之前的模型培训中加入我们的?
解决方法:
我不知道问题2的答案,但我可以回答问题1.
在评论中“将每个观察的第一个元素乘以不同的值”是一种错误的方法.
当您使用BernoulliNB或二项式时,您整合先前知识的方式是将您的知识添加到样本(数据)中.
假设你正在翻转硬币而且你知道硬币被装上了更多的头部.然后,您将添加更多显示更多头部的样本.如果您的先前知识显示70%的头部和30%的尾部:您可以向数据X添加总共100个样本,70个头部和30个尾部.