皮皮网
皮皮网

【源码行列乘法器】【源码学习框架教程】【悬赏猫源码打包】libsvm源码阅读

时间:2024-12-29 09:14:07 来源:jython源码解析

1.如何利用python使用libsvm
2.LIBSVM使用手册

libsvm源码阅读

如何利用python使用libsvm

       ä¸€ï¼šlibsvm包下载与使用:

       LIBSVM是台湾大学林智仁(Lin Chih-Jen)副教授等开发设计的一个简单、易于使用和快速有效的SVM模式识别与回归的软件包,他不但提供了编译好的可在Windows系列系统的执行文件,还提供了源代码,方便改进.

       æŠŠåŒ…解压在C盘之中,如:C:\libsvm-3.

       2.

       å› ä¸ºè¦ç”¨libsvm自带的脚本grid.py和easy.py,源码阅读需要去官网下载绘图工具gnuplot,解压到c盘

       3.

       è¿›å…¥c:\libsvm\tools目录下,用文本编辑器(记事本,edit都可以)修改grid.py和easy.py两个文件,找到其中关于gnuplot路径的那项,根据实际路径进行修改,并保存

       4python与libsvm的连接(参考SVM学习笔记(2)LIBSVM在python下的使用 )

       a.打开IDLE(python GUI),输入

       >>>import sys

       >>>sys.version

       å¦‚果你的python是位,将出现如下字符:

       â€˜2.7.3 (default, Apr , ::) [MSC v. bit (Intel)]’

       è¿™ä¸ªæ—¶å€™LIBSVM的python接口设置将非常简单。在libsvm-3.文件夹下的windows文件夹中找到动态链接库libsvm.dll,将其添加到系统目录,如`C:\WINDOWS\system\’,即可在python中使用libsvm

       b.如果你是位的请参考文献,请参考上述连接。

       5.执行一个小例子

       import os

       os.chdir('C:\libsvm-3.\python')#请根据实际路径修改

       from svmutil import

*

       y, x = svm_read_problem('../heart_scale')#读取自带数据

       m = svm_train(y[:], x[:], '-c 4')

       p_label, p_acc, p_val = svm_predict(y[:], x[:], m)

       ##出现如下结果,应该是正确安装了

       optimization finished, #iter =

       nu = 0.

       obj = -., rho = 0.

       nSV = , nBSV =

       Total nSV =

       Accuracy = .% (/) (classification)

       äºŒå‡ ä¸ªç®€å•çš„例子

       ä»Žä¸‹è½½å®žéªŒæ•°æ®é›†ã€‚并且将数据集拷贝到C:\libsvm-3.\windows下(因为之后我们需要利用该文件夹下的其他文件,这样比较方便,当然之后你用绝对地址也可以了)

       å»ºç«‹ä¸€ä¸ªpy文件,写下如下代码:

       ä¾‹1:

       import os

       os.chdir('C:\libsvm-3.\windows')#设定路径

       from svmutil import

*

       y, x = svm_read_problem('train.1.txt')#读入训练数据

       yt, xt = svm_read_problem('test.1.txt')#训练测试数据

       m = svm_train(y, x )#训练

       svm_predict(yt,xt,m)#测试

       æ‰§è¡Œä¸Šè¿°ä»£ç ï¼Œç²¾åº¦ä¸ºï¼šAccuracy = .% (/) (classification)

       å¸¸ç”¨æŽ¥å£

       svm_train() : train an SVM model#训练

       svm_predict() : predict testing data#预测

       svm_read_problem() : read the data from a LIBSVM-format file.#读取libsvm格式的数据

       svm_load_model() : load a LIBSVM model.

       svm_save_model() : save model to a file.

       evaluations() : evaluate prediction results.

       - Function: svm_train#三种训练写法

       There are three ways to call svm_train()

       >>> model = svm_train(y, x [, 'training_options'])

       >>> model = svm_train(prob [, 'training_options'])

       >>> model = svm_train(prob, param)

       æœ‰å…³å‚数的设置(read me 文件夹中有详细说明):

       Usage: svm-train [options] training_set_file [model_file]

       options:

       -s svm_type : set type of SVM (default 0)#选择哪一种svm

       0 -- C-SVC (multi-class classification)

       1 -- nu-SVC (multi-class classification)

       2 -- one-class SVM

       3 -- epsilon-SVR (regression)

       4 -- nu-SVR (regression)

       -t kernel_type : set type of kernel function (default 2)#是否用kernel trick

       0 -- linear: u'*v

       1 -- polynomial: (gamma*u'*v + coef0)^degree

       2 -- radial basis function: exp(-gamma*|u-v|^2)

       3 -- sigmoid: tanh(gamma*u'*v + coef0)

       4 -- precomputed kernel (kernel values in training_set_file)

       -d degree : set degree in kernel function (default 3)

       -g gamma : set gamma in kernel function (default 1/num_features)

       -r coef0 : set coef0 in kernel function (default 0)

       -c cost : set the parameter C of C-SVC, epsilon-SVR, and nu-SVR (default 1)

       -n nu : set the parameter nu of nu-SVC, one-class SVM, and nu-SVR (default 0.5)

       -p epsilon : set the epsilon in loss function of epsilon-SVR (default 0.1)

       -m cachesize : set cache memory size in MB (default )

       -e epsilon : set tolerance of termination criterion (default 0.)

       -h shrinking : whether to use the shrinking heuristics, 0 or 1 (default 1)

       -b probability_estimates : whether to train a SVC or SVR model for probability estimates, 0 or 1 (default 0)

       -wi weight : set the parameter C of class i to weight*C, for C-SVC (default 1)

       -v n: n-fold cross validation mode

       -q : quiet mode (no outputs)

       ä¸‰æé«˜é¢„测的准确率:

       é€šè¿‡ä¸€å®šçš„过程,可以提高预测的准确率(在文献2中有详细介绍):

       a.转换数据为libsvm可用形式.(可以通过下载的数据了解格式)

       b.进行一个简单的尺度变换

       c.利用RBF kernel,利用cross-validation来查找最佳的参数 C 和 r

       d.利用最佳参数C 和 r ,来训练整个数据集

       e.测试

       å†çœ‹ä¾‹å­1:

       1.进入cmd模式下,输入如下代码,将现有数据进行适度变换,生成变换后的数据文件train.1.scale.txt

       å‚数说明:

       -l 变换后的下限

       -u 变换后的上限

       -s 参考上文

       2执行以下代码

       import os

       os.chdir('C:\libsvm-3.\windows')#设定路径

       from svmutil import

*

       y, x = svm_read_problem('train.1.scale.txt')#读入训练数据

       yt, xt = svm_read_problem('test.1.scale.txt')#训练测试数据

       m = svm_train(y, x )#训练

       svm_predict(yt,xt,m)#测试

       ç²¾ç¡®åº¦ä¸ºAccuracy = .6% (/) (classification)。

       å¯è§æˆ‘们只是做了简单的尺度变换后,预测的正确率大大提升了。

       3通过选择最优参数,再次提高预测的准确率:(需要把tools文件下的grid.py拷贝到'C:\libsvm-3.\windows'下)

       import os

       os.chdir('C:\libsvm-3.\windows')#设定路径

       from svmutil import

*

       from grid import

*

       rate, param = find_parameters('train.1.scale.txt', '-log2c -3,3,1 -log2g -3,3,1')

       y, x = svm_read_problem('train.1.scale.txt')#读入训练数据

       yt, xt = svm_read_problem('test.1.scale.txt')#训练测试数据

       m = svm_train(y, x ,'-c 2 -g 4')#训练

       p_label,p_acc,p_vals=svm_predict(yt,xt,m)#测试

       æ‰§è¡Œä¸Šé¢çš„程序,find_parmaters函数,可以找到对应训练数据较好的参数。后面的log2c,log2g分别设置C和r的搜索范围。搜索机制是以2为底指数搜索,如 –log2c –3 , 3,1 就是参数C,从2^-3,2^-2,2^-1…搜索到2^3.

       æœç´¢åˆ°è¾ƒå¥½å‚数后,在训练的时候加上参数的设置。

       å¦å¤–,读者可以自己试试数据集2,3.

LIBSVM使用手册

       LibSVM是一种开源的支持向量机(SVM)软件包,提供源代码和可执行文件两种形式。源码阅读针对不同操作系统,源码阅读用户需按照以下步骤操作:

       1)准备数据集,源码阅读按照LibSVM要求的源码阅读格式。

       2)对数据进行简单缩放,源码阅读源码行列乘法器以便在训练过程中更有效地处理。源码阅读

       3)考虑选用RBF核函数,源码阅读它在处理非线性问题时表现优异。源码阅读

       4)通过交叉验证选择最佳参数C和g,源码阅读以优化模型性能。源码阅读

       5)使用最佳参数C和g对整个训练集进行支持向量机模型训练。源码阅读

       6)利用训练好的源码阅读源码学习框架教程模型进行测试和预测。

       LibSVM使用的源码阅读数据格式包括目标值和特征值,格式简洁且易于理解和操作。源码阅读训练数据文件包含目标值和特征值,检验数据文件仅用于计算准确度或误差。

       Svmtrain命令用于训练模型,支持多种参数设置,悬赏猫源码打包包括SVM类型、核函数类型、参数值等。例如,训练一个C-SVC分类器时,可使用参数设置:svmtrain [options] training_set_file [model_file]。淘宝溯源码奶粉

       Svmpredict命令用于使用已有模型进行预测,其用法为:svmpredict test_file model_file output_file。

       SVMSCALE工具用于对数据集进行缩放,目的是避免特征值范围过大或过小,防止在训练过程中出现数值计算困难。缩放规则可以保存为文件,tc大漠插件源码便于后续使用。

       LibSVM提供了一个实用的训练数据实例:heart_scale,用于参考数据文件格式和练习软件操作。用户还可以编写小程序将常用数据格式转换为LibSVM要求的格式。

       总之,LibSVM提供了全面的支持向量机模型训练与预测工具,用户需按照文档指导准备数据、设置参数、训练模型和进行预测。LibSVM的灵活性和高效性使其在数据挖掘、机器学习等领域得到广泛应用。

扩展资料

       LIBSVM是台湾大学林智仁(Lin Chih-Jen)副教授等开发设计的一个简单、易于使用和快速有效的SVM模式识别与回归的软件包,他不但提供了编译好的可在Windows系列系统的执行文件,还提供了源代码,方便改进、修改以及在其它操作系统上应用;该软件对SVM所涉及的参数调节相对比较少,提供了很多的默认参数,利用这些默认参数可以解决很多问题;并提供了交互检验(Cross Validation)的功能。该软件包可在http://www.csie.ntu.edu.tw/~cjlin/免费获得。该软件可以解决C-SVM、ν-SVM、ε-SVR和ν-SVR等问题,包括基于一对一算法的多类模式识别问题。

更多内容请点击【娱乐】专栏