600字范文 > 基于朴素贝叶斯分类器的西瓜数据集 2.0 预测分类_机器学习之朴素贝叶斯

基于朴素贝叶斯分类器的西瓜数据集 2.0 预测分类_机器学习之朴素贝叶斯

时间：2019-04-03 04:04:53

1.贝叶斯原理

朴素贝叶斯分类(Naive Bayesian，NB)源于贝叶斯理论，是一类基于概率的分类器，其基本思想：假设样本属性之间相互独立，对于给定的待分类项，求解在此项出现的情况下其他各个类别出现的概率。

朴素贝叶斯分类实现的三阶段：

第一阶段，准备工作。

根据具体情况确定特征属性，并对每一特征属性进行划分，然后人工对一些待分类项进行分类，形成训练样本集合。

这一阶段的输入是所有待分类数据，输出是特征属性和训练样本。唯一需要人工处理的阶段，质量要求较高。

第二阶段，分类器训练阶段(生成分类器)。

计算每个类别在训练样本中出现频率及每个特征属性划分对每个类别的条件概率估计，并将结果记录。

其输入是特征属性和训练样本，输出是分类器。

第三阶段，应用阶段。

使用分类器对待分类项进行分类，其输入是分类器和待分类项，输出是待分类项与类别的映射关系。

caret中train函数e1071包中的naiveBayes函数klaR包中的NavieBayes函数

2.1数据准备

我们将在Rstudio中使用这三种朴素贝叶斯函数对威斯康星州乳腺癌数据集进行分类。

#设置路径

setwd("F:360MoveData甥敳獲Administrator.PC-04251340Desktop机器学习课程决策树")

#读入数据

breast

#设置class为分类变量

df

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。