深入解析:svm支持向量机python代码
admin
2024-05-23 10:26:00
0

下面是使用 scikit-learn 库中的 SVM 模型的示例代码:

from sklearn import svm
from sklearn.datasets import make_classification# generate some example data
X, y = make_classification(n_features=4, random_state=0)# fit an SVM model to the data
clf = svm.SVC(kernel='linear')
clf.fit(X, y)# predict new data
print(clf.predict([[0, 0, 0, 0]]))

文章目录

    • 什么是支持向量机
    • 用 Python 实现 SVM
      • 使用 scikit-learn 库实现 SVM 分类
    • 多项式和高斯核函数的 SVM
    • 总结

什么是支持向量机

支持向量机(SVM),SVM 的目的是在数据集中找到一条最佳分隔超平面,使得在这个超平面两侧的数据分别属于不同的类别,且该超平面与最近的数据点之间的距离最大。
这些最近的数据点称为支持向量,因此该模型被称为支持向量机。
SVM 可以处理线性可分和线性不可分的情况,也可以通过使用核函数来处理非线性问题。

SVM 在解决分类问题时,通常是通过构造一个最大间隔分离超平面来实现的。
在回归问题中,SVM 通过构造一个回归超平面来实现预测。

SVM 的核心思想是利用数学方法将高维数据映射到低维空间,从而对不可分数据进行线性分类。
SVM 模型具有很好的泛化能力,可以解决高维数据的分类问题。

SVM 模型可以使用不同的核函数,如线性核、多项式核、高斯核等,这样可以解决非线性问题。此外,SVM 还可以处理大量特征数据,并具有高效的计算速度。

用 Python 实现 SVM

使用 scikit-learn 库实现 SVM 分类

import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score# 加载数据集
iris = datasets.load_iris()
X = iris["data"]
y = iris["target"]# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)# 创建 SVM 模型
model = SVC(kernel='linear', C=1, random_state=0)# 训练模型
model.fit(X_train, y_train)# 在测试集上进行预测
y_pred = model.predict(X_test)# 计算预测精度
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)
  • 首先使用 load_iris() 函数加载 iris 数据集,然后使用 train_test_split() 函数将数据集划分为训练集和测试集。
  • 接着,使用 SVC 函数创建一个 SVM 模型,并使用 fit() 函数在训练集上进行训练。
  • 最后,使用 predict 函数在测试集上进行预测,并使用 accuracy_score() 函数计算预测精度。

多项式和高斯核函数的 SVM

使用高斯核函数的 SVM 可以如下实现:

import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score# 加载数据集
iris = datasets.load_iris()
X = iris["data"]
y = iris["target"]# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)# 创建 SVM 模型,使用高斯核函数
model = SVC(kernel='rbf', C=1, random_state=0)# 训练模型
model.fit(X_train, y_train)# 在测试集上进行预测
y_pred = model.predict(X_test)# 计算预测精度
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)

在上面的代码中,首先加载了 scikit-learn 中的 iris 数据集,并将其特征数据存储在 X 中,标签存储在 y 中。

使用 train_test_split() 函数划分出了训练集和测试集,并将其分别存储在 X_trainX_testy_trainy_test 中。

创建了一个 SVM 模型,使用了高斯核函数(Radial basis function, RBF)。参数 C 用于控制对误差的惩罚程度,数值越大,惩罚程度越大。参数 gamma 控制高斯核函数的影响范围,数值越小,影响范围越广。

使用 fit() 方法训练模型。训练后,使用 predict() 方法在测试集上进行预测,并将预测结果存储在 y_pred 中。

最终的结果将通过 accuracy_score() 函数计算预测精度,并将其打印出来。

还可以调整 SVM 模型的超参数以改变模型的表现,例如 Cgamma 。通过调整超参数可以使模型更加适合数据,并提高模型的预测精度。

总结

📢📢📢📢📢📢
💗 你正在阅读 【梦想橡皮擦】 的博客
👍 阅读完毕,可以点点小手赞一下
🌻 发现错误,直接评论区中指正吧
📆 橡皮擦的第 863 篇原创博客

👇 全网 6000+人正在学习的 爬虫专栏 👇👇👇👇

  • ⭐️ Python 爬虫 120,点击订购 ⭐️
  • ⭐️ 爬虫 100 例教程,点击订购 ⭐️

相关内容

热门资讯

斗金订购APP贵金属期货投资被...   斗金订购APP的投资者被广告宣传给诱导,注册就送什么现金,然后充值返现金卷等等这些宣传方式,都是...
哈易购APP非法期货交易欺骗投...   哈易购APP宣传可做白银铂金贵金属订购交易,但实际上并没有取得相关交易资质!哈易购APP本质上就...
消息称百度旗下昆仑芯瞄准500... 6 月 29 日消息,据《The Information》昨日援引知情人士消息,百度旗下 AI 芯片...
打造夏日消费新场景 第35届北... 北京商报讯(记者 翟枫瑞)6月29日消息,第35届北京国际燕京啤酒文化节新闻发布会在京举行。本届啤酒...
社保基金持仓数据出炉,一季度增... 最近各大上市公司一季度财报都公开了,咱们国家社保基金的持仓数据也全部曝光。目前社保拿着比亚迪价值44...
36氪首发 | 海思、中兴团队... 作者 | 乔钰杰 编辑 | 袁斯来 硬氪获悉,广州宸思通讯科技有限公司(以下简称“宸思科技”)近日完...
两天蒸发47亿市值!一纸税务通... 一纸税务通知书,能让一家百亿龙头两天蒸发47亿市值。 6月22日,北大荒(600598.SH)公告称...
SK海力士将投资1100万亿韩... SK集团会长崔泰源6月29日在韩国“三大重大计划”发布会上宣布,公司将投资1100万亿韩元扩大半导体...
两只A股,终止上市! 两家A股公司,即将摘牌。 6月29日,退市沪科(600608.SH)公告称,上海证券交易所将在202...
原创 M... 一家成立近十年的自动驾驶公司,在IPO时吸引了14家基石投资者认购近一半的发行股份,其中不乏奔驰、比...
基金忠言|国寿安保滤镜碎,三年... 图片来源:视觉中国 蓝鲸新闻6月29日讯(记者 祁和忠)保险系基金公司国寿安保总经理换人了。 6月2...
三星电机计划加码玻璃基板!相关... 6月29日,玻璃基板概念股午后有所回升, 华工科技(000988.SZ)逼近涨停, 彩虹股份(600...
拉萨海关持续壮大外贸经营主体 ...   新华网拉萨6月28日电(记者蒋梦辰)近日,记者从拉萨海关获悉,今年前5个月,西藏有进出口实绩的外...
机构:二季报临近,医药生物板块... 6月29日,华源证券发布了一篇医药生物行业的研究报告,报告指出,业绩期临近,产业链景气度有望再次迎来...
每日收评科创50放量涨超4.5... 财联社6月29日讯,三大指数全线收红,创业板指探底回升,科创50指数大涨4.61%。沪深两市成交额3...
6月多地土拍结构性升温:深圳单... 进入2026年6月,不少城市核心区地块集中诞生高溢价宗地,热度突出的城市包含深圳、杭州、长沙。 其中...
业绩炸裂!盛达资源半年预盈3.... 6月29日,贵金属矿山龙头盛达资源(000603.SZ)发布 2026 年半年度业绩预告,上半年业绩...
A股午后拉升三大股指收涨:半导... A股三大股指6月29日开盘涨跌互现。早盘沪强深弱,创指一度跌超2%。半导体午后拉升,带动两市上涨,沪...
原创 空... 前言 大家好,我是老金。 这几天,两幅极度割裂的画面放在一起,把我看笑了。 一边是在持续的热浪下,欧...