鸢尾花数据集,特征为连续值数据的决策树的多分类
admin
2024-02-01 13:15:15
0

1.导入工具

import pandas as pd
from sklearn import preprocessing
from sklearn import tree
from sklearn.datasets import load_iris

2.导入鸢尾花数据集,探索数据集
iris=load_iris()
#iris是一个字典,包含了数据、标签、标签名、数据描述等信息。可以通过键来索引对应值。
iris
#查看iris字典里的所有键
dir(iris)
iris.data
#150个数据,每个数据都有四个维度的特征,每个特征都是连续数值
iris.data.shape
#四个特征列名
iris.feature_names
#标签,0,1,2对应三种不同的鸢尾花
iris.target
#三种鸢尾花的名字
iris.target_names
鸢尾花数据集的描述说明信息
print(iris.DESCR)

3.构建决策树模型
dir(iris)
clf=tree.DecisionTreeClassifier(max_depth=4)
clf=clf.fit(iris.data, iris.target)
clf

4.可视化决策树
import pydotplus
from IPython.display import Image,display
dot_data=tree.export_graphviz(clf,
                             out_file=None,
                             feature_names=iris.feature_names,
                             class_names=iris.target_names,
                             filled=True,
                             rounded=True
                             )
graph=pydotplus.graph_from_dot_data(dot_data)
display(Image(graph.create_png()))


5.对整个训练集做预测
clf.predict(iris.data)

6.对单个样本做预测
#假设有一朵新的鸢尾花,四个特征分别为6.6cm,2.5cm,4.3cm,1,3cm。用训练好的决策树判断它属于哪一类鸢尾花。
import numpy as np
a1=np.array([6.6, 2.5, 4.3, 1.3])
a1
a1.shape
a1.reshape(1,-1).shape
clf.predict(a1.reshape(1,-1))
#属于第二类鸢尾花。
7.对多个样本做预测
a1=iris.data[30]
a2=iris.data[70]
a3=iris.data[120]
import numpy as np
b=np.row_stack((a1,a2,a3))
b
clf.predict(b)
import numpy as np
import matplotlib.pyplot as plt
%matplotlib.colors import ListedIormap
from matplotlib.colors import ListedColormap 
from sklearn import datasets
from sklearn import tree
iris=datasets.load_iris()
x=iris.data[:,2:4]#取出花瓣的长和宽
y=iris.target#取出标签
#计算散点图的上下界
x_min,x_max=x[:,0].min() -.5,  x[:,0].max()+.5
y_min,y_max=x[:,1].min() -.5,  x[:,1].max()+.5
#绘制边界
camo=cmap_light=ListedColormap(['#AAAAFF','#AAFFAA','#FFAAAA'])
h=.02
xx,yy=np.meshgrid(np.arange(x_min,x_max,h),np.arange(y_min,y_max,h))
clf=tree.DecisionTreeClassifier(max_depth=4)
clf=clf.fit(x, y)
Z=clf.predict(np.c_[xx.ravel(),yy.ravel()])
Z=Z.reshape(xx.shape)
plt.figure()
plt.pcolormesh(xx,yy,Z,cmap=cmap_light)
plt.scatter(x[:,0],x[:,1],c=y) 
plt.xlim(xx.min(),xx.max())
plt.ylim(yy.min(),yy.max())
plt.show()
 

相关内容

热门资讯

AI驱动存储芯片结构性短缺,C... 今日(1.21),芯片板块高歌猛进,全市场费率最低档的芯片50ETF(516920)放量大涨超4%,...
原创 5... 身边很多朋友过了五十岁都开始关心体重这事情,有人说着千金难买老来瘦,也有人担心太瘦了没力气。今天,木...
软件板块强势拉升!久其、浙文互... 1月21日,A股AI应用概念股延续强势回升态势,久其软件(002279.SZ)、浙文互联(60098...
和讯投顾鲁鹏:4100守得住吗... 震荡十字星,明天周三要跑了吗?和讯投顾鲁鹏分析,昨天一根反包小阳线,大家都以为这波反弹行情稳了,市场...
观察|去年深圳8家银行密集“换... 深圳“十五五”规划锚定了全球“产业金融中心”的蓝图坐标,对本地金融业尤其银行机构的“角色扮演”提出更...
688041,成交额A股第一 今日早盘,A股市场震荡走强,有色金属与泛科技主线领涨,带动主要股指集体飘红。截至午间休市,上证指数报...
德风科技冲刺港股IPO:聚焦A... 北京德风新征程科技股份有限公司(以下简称“德风科技”)正式向港交所提交招股书,计划在香港进行首次公开...
首份上市城商行2025年业绩快... A股上市银行中首份城商行业绩快报出炉! 1月20日晚间,宁波银行(002142.SZ)发布2025年...
股市大涨旗下基金仍亏32%,长... 文|天峰 来源|财富独角兽 2026年开年以来,A股市场呈现出强劲的上涨势头,主要指数都录得了显著...
原创 电... 2026年1月20日,今年的淘天集团商家服务大会如期举行,来自全国各地的一千多个淘宝、天猫店铺的相关...
固德电材IPO:出售固德德阳、... 《电鳗财经》电鳗号/文 2026年1月8日,证监会官网显示,固德电材系统(苏州)股份有限公司(简...
现货黄金首破4840美元!国内... 来源:中新经纬APP 21日早盘,现货黄金站上4840美元/盎司,续刷新高。 截至发稿,伦敦金现涨1...
跟着门店扩张来炒股!公募布局思... 春节临近,门店扩张逻辑驱动线下消费板块迎来估值修复,公募基金重仓的连锁消费龙头股价表现亮眼。 因景气...
东易日盛陈辉:还款日,才真正打... 乐居财经 李兰1月20日,东易日盛于北京举办“穿越·共生”老友茶叙,这是公司司法重整计划执行完毕后的...
知名大V被罚超8300万元!雪... 1月19日,浙江证监局发布行政处罚决定书,对雪球大V金永荣操纵证券市场行为作出处罚。 金永荣因通过“...
2370万!全民拯救李亚鹏背后... *此图由AI生成 作者| 史大郎&猫哥 来源| 是史大郎&大猫财经Pro “嫣然天使儿童医院也许会...
高新技术企业“摘帽”的警示(纵... 余明辉 据不完全统计,2025年,超4300家企业被剔除出高新技术企业行列。仅2025年12月,北京...
港股异动丨TCL电子飙升超16... TCL电子(1070.HK)盘中一度大涨超16%,报12.67港元,股价创2004年9月以来新高。消...
2026全球纳豆激酶行业白皮书... 前言:在全球心脑血管疾病防控需求升级及“非药物干预”理念普及背景下,纳豆激酶作为源自传统发酵食品的天...
微软CEO纳德拉:能源成本成人... 【环球网科技综合报道】1月21日消息,据CNBC报道,在近日举行的世界经济论坛(WEF)上,微软首席...