博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
决策树
阅读量:6358 次
发布时间:2019-06-23

本文共 2138 字,大约阅读时间需要 7 分钟。

1|—— rpart函数 shuttle数据集

数据集:

分类问题:      stability  error sign  wind     magn      vis     use1       xstab    LX    pp    head    Light      no     auto2       xstab    LX    pp    head    Medium     no     auto3       xstab    LX    pp    head    Strong     no     auto4       xstab    LX    pp    tail     Light     no     auto...256

代码:

1 library(MASS)2 shuttle#加载shuttle数据集3 m=256;set.seed(2)4 5 samp = sample(1:m,floor(m/10))#测试样本6 tsamp = setdiff(1:m,samp) #训练样本

绘图:

1 library(rpart.plot)2 (b=rpart(use~.,shuttle,subset=tsamp))#数据加入模型3 plot(b);text(b,use.n=T)4 rpart.plot(b,type=2)#另一种绘图方式

     rpart.plot(b,type=1)               rpart.plot(b,type=2)              

       

          分类的效果还是不错的,but这是数据洗的好啊...

 

1 #预测2 predict(b, shuttle[samp,],type="prob")   # 返回每个样本被预测为各类别的概率3 predict(b, shuttle[samp,],type="vector") # 以各类别的水平值显示各样本的预测结果4 predict(b, shuttle[samp,],type="class")  # 以各类别名称显示各样本的预测结果5 predict(b, shuttle[samp,],type="matrix") # 以矩阵形式综合输出"以类别水平值表示的预测结果"、"类别频率"、"预测概率"

 

outcome:

1       [,1] [,2]   [,3]       [,4]            [,5]          [,6] 2 48     1    115    0     1.00000000       0.0000000   0.49783550 3 180    2    4     82     0.04651163       0.9534884   0.37229437 4 146    2    4     82     0.04651163       0.9534884   0.37229437 5 43     1  115     0      1.00000000       0.0000000   0.49783550 6 238    2    4     82     0.04651163     0.9534884   0.37229437 7 237    2    0     14     0.00000000      1.0000000   0.06060606 8 33     1  115     0      1.00000000     0.0000000   0.49783550 9 208    2    4     82     0.04651163     0.9534884   0.3722943710 117    1  115     0      1.00000000       0.0000000   0.4978355011 136    2    4     82     0.04651163       0.9534884   0.3722943712 247    2    4     82     0.04651163       0.9534884   0.3722943713 59     1  115     0      1.00000000       0.0000000   0.4978355014 ...

 

 

t(table(predict(b,shuttle[tsamp,],type="class"),shuttle[tsamp,7])) # 对tsamp进行样本内预测,并输出混淆矩阵;t()为转置函数,可以不用t(table(predict(b,shuttle[samp,],type="class"),shuttle[samp,7])) # 对samp进行样本外预测,并输出混淆矩阵;

 

OUTCOME:

     _ tsamp集合                _samp集合

 

  

 

转载于:https://www.cnblogs.com/JoyHan/p/5620417.html

你可能感兴趣的文章
解决IE二级链接无法打开故障
查看>>
Windows phone应用开发[16]-数据加密
查看>>
SQL Server 迁移数据到MySQL
查看>>
通用数据压缩算法简介
查看>>
The next Industry Standard in IT Monitoring, a python implementation Nagios like tool --- Shinken
查看>>
(笔记)找工作,该怎么进补
查看>>
div的显示和隐藏以及点击图标的更改
查看>>
(轉貼) Ubuntu將在ARM平台netbook上現身 (SOC) (News) (Linux) (Ubuntu)
查看>>
SQL注入测试工具:Pangolin(穿山甲)
查看>>
在html 的img属性里只显示图片的部分区域(矩形,给出开始点和结束点),其他部份不显示,也不要拉伸...
查看>>
程序员第二定律:量化管理在程序员身上永无可能
查看>>
ubuntu一些脚本的执行顺序
查看>>
类继承的结构
查看>>
Intel 被 ARM 逼急了
查看>>
testng + reportng 测试结果邮件发送
查看>>
百度亮相iDASH,推动隐私保护在人类基因组分析领域的应用
查看>>
Python「八宗罪」
查看>>
你的隐私还安全吗?社交网络中浏览历史的去匿名化
查看>>
NeurIPS 2018|如何用循环关系网络解决数独类关系推理任务?
查看>>
Windows 10 份额突破 40%,Windows 7 连跌四月终回升
查看>>