AI导航网

技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

【SVM】理解与使用(不好完全掌握，知道如何使用即可)

时间：2020-11-18分类：算法作者：编程之家

1：原理理解@H_404_1@

@H_404_1@@H_404_1@

@H_404_1@

@H_404_1@

图中有分别属于两类的一些二维数据点和三条直线。如果三条直线分别代表三个分类器的话，请问哪一个分类器比较好？@H_404_1@

我们凭直观感受应该觉得答案是H3。首先H1不能把类别分开，这个分类器肯定是不行的；H2可以，但分割线与最近的数据点只有很小的间隔，如果测试数据有一些噪声的话可能就会被H2错误分类(即对噪声敏感、泛化能力弱)。H3以较大间隔将它们分开，这样就能容忍测试数据的一些噪声而正确分类，是一个泛化能力不错的分类器。@H_404_1@

对于支持向量机来说，数据点若是

$p$ @H_404_1@维向量，我们用

$p-1$ @H_404_1@维的超平面来分开这些点。但是可能有许多超平面可以把数据分类。最佳超平面的一个合理选择就是以最大间隔把两个类分开的超平面。因此，SVM选择能够使离超平面最近的数据点的到超平面距离最大的超平面。@H_404_1@

以上介绍的SVM只能解决线性可分的问题，为了解决更加复杂的问题，支持向量机学习方法有一些由简至繁的模型:@H_404_1@

线性可分SVM

@H_502_29@当训练数据线性可分时，通过硬间隔(hard margin，什么是硬、软间隔下面会讲)最大化可以学习得到一个线性分类器，即硬间隔SVM，如上图的的H3。

线性SVM

@H_502_29@当训练数据不能线性可分但是可以近似线性可分时，通过软间隔(soft margin)最大化也可以学习到一个线性分类器，即软间隔SVM。

非线性SVM

@H_502_29@当训练数据线性不可分时，通过使用核技巧(kernel trick)和软间隔最大化，可以学习到一个非线性SVM。

2：使用@H_404_1@

import numpy as np
import sklearn.svm  sk_svm
import sklearn.datasets  datasets

iris = datasets.load_iris() # 鸟分类数据集
X = iris['data']
y = iris[target]

from sklearn.model_selection import train_test_split
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size = 0.2)
print("训练集:",X_train.shape,y_train.shape)
print(测试集:1,kernel=rbf',gamma=auto)
model.fit(X_train,y_train)
acc=model.score(X_test,y_test) #根据给定数据与标签返回正确率的均值
print(SVM模型评价:@H_404_1@

@H_404_1@

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 [email protected] 举报，一经查实，本站将立刻删除。

相关推荐

负数原码与补码之间相互转换

背景：计算机内部用补码表示二进制数。符号位1表示负数，0表示正数。正数：无区别，正数的原码= 反码 = 补码重点讨论负数若已知负数 -8，则其原码为：1000 1000，（1为符号位，为1代表负数，为0代表正数）反码为：...

作者：thlzjfefe 时间：2022-12-16

MD5 加密算法介绍

大家好,我们现在来讲解关于加密方面的知识,说到加密我认为不得不提MD5,因为这是一种特殊的加密方式,它到底特殊在哪,现在我们就开始学习它全称:message-digest algorithm 5翻译过来就是:信息摘要算法 5加密和摘要，...

作者：thlzjfefe 时间：2022-12-16

新的快速排序算法: 《Dual-Pivot QuickSort》阅读笔记

相信大家在大学的《算法与数据结构》里面都学过快速排序(QuickSort), 知道这种排序的性能很好，JDK里面直到JDK6用的都是这种经典快排的算法。但是到了JDK7的时候JDK内置的排序算法已经由经典快排变成了Dual-Pivot排序...

作者：thlzjfefe 时间：2022-12-16

对称加密与非对称加密

加密在编程中的应用的是非常广泛的，尤其是在各种网络协议之中，对称/非对称加密则是经常被提及的两种加密方式。对称加密我们平时碰到的绝大多数加密就是对称加密，比如：指纹解锁，PIN 码锁，保险箱密码锁，账号密码...

作者：thlzjfefe 时间：2022-12-16

详解vue的diff算法

前言我的目标是写一个非常详细的关于diff的干货，所以本文有点长。也会用到大量的图片以及代码举例，目的让看这篇文章的朋友一定弄明白diff的边边角角。先来了解几个点...1. 当数据发生变化时，vue是怎么更新节点的？...

作者：thlzjfefe 时间：2022-12-16

对称加密算法

对称加密算法所有的对称加密都有一个共同的特点：加密和解密所用的密钥是相同的。现代对称密码可以分为序列密码和分组密码两类：序列密码将明文中的每个字符单独加密后再组合成密文；而分组密码将原文分为若干个...

作者：thlzjfefe 时间：2022-12-16

RSA密钥长度、明文长度和密文长度

本文介绍RSA加解密中必须考虑到的密钥长度、明文长度和密文长度问题，对第一次接触RSA的开发人员来讲，RSA算是比较复杂的算法，RSA算法自己其实也很简单，RSA的复杂度是由于数学家把效率和安全也考虑进去的缘故。htm...

作者：thlzjfefe 时间：2022-12-16

布隆过滤器(Bloom Filter)详解

直观的说，bloom算法类似一个hash set，用来判断某个元素（key）是否在某个集合中。和一般的hash set不同的是，这个算法无需存储key的值，对于每个key，只需要k个比特位，每个存储一个标志，用来判断key是否在集合中...

作者：thlzjfefe 时间：2022-12-16

如何防范密码被破解

你会用什么样的算法来为你的用户保存密码？如果你还在用明码的话，那么一旦你的网站被hack了，那么你所有的用户口令都会被泄露了，这意味着，你的系统或是网站就此完蛋了。所以，我们需要通过一些不可逆的算法来保存...

作者：thlzjfefe 时间：2022-12-16

Excel表格如何筛选重复内容筛选重复数据的方法

在日常工作中经常会使用excel，有时在表格中需要筛选出重复的数据，该怎么操作呢？1、以下图中的表格数据为例，筛选出列中重复的内容；2、打开文件，选中需要筛选的数据列，依次点击菜单项【开始】-【条件格式】-【突...

作者：thlzjfefe 时间：2022-12-16