鸢尾花数据集,特征为连续值数据的决策树的多分类
admin
2024-02-01 13:15:15
0

1.导入工具

import pandas as pd
from sklearn import preprocessing
from sklearn import tree
from sklearn.datasets import load_iris

2.导入鸢尾花数据集,探索数据集
iris=load_iris()
#iris是一个字典,包含了数据、标签、标签名、数据描述等信息。可以通过键来索引对应值。
iris
#查看iris字典里的所有键
dir(iris)
iris.data
#150个数据,每个数据都有四个维度的特征,每个特征都是连续数值
iris.data.shape
#四个特征列名
iris.feature_names
#标签,0,1,2对应三种不同的鸢尾花
iris.target
#三种鸢尾花的名字
iris.target_names
鸢尾花数据集的描述说明信息
print(iris.DESCR)

3.构建决策树模型
dir(iris)
clf=tree.DecisionTreeClassifier(max_depth=4)
clf=clf.fit(iris.data, iris.target)
clf

4.可视化决策树
import pydotplus
from IPython.display import Image,display
dot_data=tree.export_graphviz(clf,
                             out_file=None,
                             feature_names=iris.feature_names,
                             class_names=iris.target_names,
                             filled=True,
                             rounded=True
                             )
graph=pydotplus.graph_from_dot_data(dot_data)
display(Image(graph.create_png()))


5.对整个训练集做预测
clf.predict(iris.data)

6.对单个样本做预测
#假设有一朵新的鸢尾花,四个特征分别为6.6cm,2.5cm,4.3cm,1,3cm。用训练好的决策树判断它属于哪一类鸢尾花。
import numpy as np
a1=np.array([6.6, 2.5, 4.3, 1.3])
a1
a1.shape
a1.reshape(1,-1).shape
clf.predict(a1.reshape(1,-1))
#属于第二类鸢尾花。
7.对多个样本做预测
a1=iris.data[30]
a2=iris.data[70]
a3=iris.data[120]
import numpy as np
b=np.row_stack((a1,a2,a3))
b
clf.predict(b)
import numpy as np
import matplotlib.pyplot as plt
%matplotlib.colors import ListedIormap
from matplotlib.colors import ListedColormap 
from sklearn import datasets
from sklearn import tree
iris=datasets.load_iris()
x=iris.data[:,2:4]#取出花瓣的长和宽
y=iris.target#取出标签
#计算散点图的上下界
x_min,x_max=x[:,0].min() -.5,  x[:,0].max()+.5
y_min,y_max=x[:,1].min() -.5,  x[:,1].max()+.5
#绘制边界
camo=cmap_light=ListedColormap(['#AAAAFF','#AAFFAA','#FFAAAA'])
h=.02
xx,yy=np.meshgrid(np.arange(x_min,x_max,h),np.arange(y_min,y_max,h))
clf=tree.DecisionTreeClassifier(max_depth=4)
clf=clf.fit(x, y)
Z=clf.predict(np.c_[xx.ravel(),yy.ravel()])
Z=Z.reshape(xx.shape)
plt.figure()
plt.pcolormesh(xx,yy,Z,cmap=cmap_light)
plt.scatter(x[:,0],x[:,1],c=y) 
plt.xlim(xx.min(),xx.max())
plt.ylim(yy.min(),yy.max())
plt.show()
 

相关内容

热门资讯

原创 中... 编辑:[太阳] 4月30日,美国先出现了一幕很耐人寻味的场景。路透社披露,北京在本月推出一套新的贸易...
️金价下跌+典当整治!5个典当... 近期金价持续下行,加上国家对典当行业的整治力度加大,一批无资质的“伪典当行”被清退,但仍有不少人急着...
美国上市公司迎重大变革:SEC... 5月6日消息,美国证券交易委员会(SEC)发布一项提议,取消美国上市公司强制进行的季度报告制度,允许...
激战大疆9个月,进击的影石在2... 守旧城、筑新墙,2026年是影石的“转折点”。 作者 | 刘亮 编辑 | 趣解商业TMT组 过去9个...
沙漠里的算力革命_中国首个算电... 2026年,一座光伏电站的投运,让一片黄沙有了新的意义。中国大唐中卫云基地50万千瓦光伏电站正式并网...
刘军连:白癜风患者,避免过量摄... 辛辣刺激性食物如辣椒、花椒、生蒜、芥末等,虽能提升食欲,但过量摄入会对白癜风患者的病情造成不利影响。...
4月27日-5月3日A股IPO... 中国上市公司网/文 4月27日-5月3日期间IPO动态各个阶段速览: 一、IPO排队企业情况(289...
A股,五月开门红!除了满屏涨停... 每经记者|肖芮冬 每经编辑|赵云 5月6日,市场震荡反弹,科创50指数一度涨超9%,逼近历史高位。...
原创 油... 国内车主迎来重大利好!近期国际油价持续疯狂跳水,5 月 5 日,WTI 原油期货暴跌 4%,报 10...
原创 低... 王叔还记得,十年前他在银行存了一张三年期定期存单,利率4.25%。每年利息4250元,足够给孙辈包个...
京东方CEO冯强:以SID为平... 5月6日,有着显示界“奥斯卡”之称的SID 2026(国际显示周)展会在美国开幕,作为全球显示产业的...
西安企业管理公司实力排名推荐(... 西安企业管理公司实力排名推荐(2026年) 在陕西企业数字化转型加速的背景下,薪酬绩效咨询成为企业管...
科麦特科由董事长虞家桢夫妇控制... 瑞财经 吴文婷近日,江苏科麦特科技发展股份有限公司(以下简称“科麦特科”)披露北交所IPO辅导工作完...
量质齐升!五一叠加广交会,广州... 五一假期,广州紧抓消费黄金期,叠加第139届广交会第三期展会,“政策+活动”双轮驱动,消费市场供需两...
金观平:聚焦需求找准服务业增长... 作为经济发展的“主引擎”,服务业在国民经济中的地位日益凸显,迎来快速发展期。一季度,我国服务业增加值...
追觅俞浩直言小米两大短板:过度... 俞浩是真的不把网友当外人,最近他在社交平台疯狂发布短视频,输出自己的各种观点。 比如,今日俞浩发布视...
OpenAI高层财务关系曝光:... OpenAI联合创始人兼总裁格雷格·布罗克曼(Greg Brockman)在法庭上披露了他与首席执行...
IPO动态丨本周美股预告:Od... 回顾:上周17只新股上市,其中12只为SPAC,如下: Pershing Square(PS)以每股...