朴素贝叶斯(Naive Bayes)是一种基于贝叶斯定理的分类算法,它假设特征之间相互独立。朴素贝叶斯算法在文本分类、垃圾邮件过滤等领域有广泛应用。
常见的朴素贝叶斯算法有:
假设你已经训练好了一个多项式朴素贝叶斯模型,并且有一个新的数据集需要测试。以下是一个示例代码:
from sklearn.naive_bayes import MultinomialNB
from sklearn.feature_extraction.text import CountVectorizer
import numpy as np
# 假设你已经有了训练数据和标签
train_data = ["I love this product", "This is a great product", "Terrible experience"]
train_labels = [1, 1, 0] # 1表示正面评价,0表示负面评价
# 特征提取
vectorizer = CountVectorizer()
X_train = vectorizer.fit_transform(train_data)
# 训练朴素贝叶斯模型
model = MultinomialNB()
model.fit(X_train, train_labels)
# 新数据
new_data = ["This product is amazing", "Worst experience ever"]
# 特征提取
X_new = vectorizer.transform(new_data)
# 预测新数据
predictions = model.predict(X_new)
print("Predictions:", predictions)
通过以上步骤,你可以在现有的朴素贝叶斯算法中测试新数据,并解决可能遇到的问题。
领取专属 10元无门槛券
手把手带您无忧上云