这次介绍如何利用weka里的类对数据集进行分类,要对数据集进行分类,第一步要指定数据集中哪一列做为类别,如果这一步忘记了(事实上经常会忘记)会出现“Class index is negative (not set)!”这个错误,设置某一列为类别用Instances类的成员方法setClassIndex,要设置最后一列为类别则可以用Instances类的numAttributes()成员方法得到属性的个数再减1。
然后选择分类器,比较常用的分类器有J48,NaiveBayes,SMO(LibSVM有Java版的,可以在weka中使用,但要设置路径),训练分类器使用J48的buildClassifier(注意J48还有别的分类器它们都继承自Classifier类,使用方法都差不多),分类数据用J48类中的classifyInstance方法,例中使用的数据集为contact-lenses.arff,分类结果为2.0,结果为2.0的原因是:首先用文本编辑器打开数据集,有一行为@attribute contact-lenses {soft, hard, none},而第一个样本为young, myope, no, reduced, none,最后一列为类别,也就是contact-lences为类别,第一个样本的类别为none,在属性说明中none为第二个所以为2.0(从0开始数)。
package com.cizito.weka.study; import weka.classifiers.bayes.NaiveBayes; import weka.classifiers.functions.SMO; import weka.classifiers.trees.J48; import weka.core.Instances; import weka.core.converters.ConverterUtils.DataSource; /** * @author zhangwei * */ public class ClassifierTest { private Instances m_instances = null; /** * @param args */ public static void main(String[] args) throws Exception{ ClassifierTest ctest = new ClassifierTest(); ctest.getFileInstances( "D:/ProgramFiles/Weka-3-6/data/contact-lenses.arff"); ctest.classify(); } public void getFileInstances( String fileName ) throws Exception { DataSource frData = new DataSource( fileName ); m_instances = frData.getDataSet(); m_instances.setClassIndex( m_instances.numAttributes()-1); } public void classify() throws Exception { //J48 classifier = new J48(); NaiveBayes classifier = new NaiveBayes(); //SMO classifier = new SMO(); classifier.buildClassifier( m_instances ); System.out.println( classifier.classifyInstance( m_instances.instance( 0 ) ) ); } }
相关推荐
Weka开发[2]-分类器类 2 Weka开发[3]-Evaluation类 3 Weka开发[4]-特征选择 4 Weka开发[5]-半监督算法 6 Weka开发[0]-导入Weka包 8 半监督算法工具SVMlin使用 12 半监督算法工具SVMlin读取数据代码...
该文件有一个示例,说明如何从 MATLAB 运行 WEKA Logistic 回归分类器,并将 ridge 参数传递给它。
欢迎描述:SplitRules 软件对文本文件中包含的规则进行分离,该文件包含从 Weka 软件生成的分类器树中获得的结果。 该软件生成的输出是一个文本文件,其中包含使用 IF-THEN 条件结构的单独规则。 该软件是作者 José...
Weka 是一个全面的开源机器学习工具包,在新西兰怀卡托大学用 Java ... 这些函数为 Weka 提供了一个基本的 Matlab 接口,允许您来回传输数据并访问主要的 Weka 功能,例如训练分类器。 他们已经过 Weka 3.5 版的测试
LibSVM分类 Weka 平台内部没有集成libSVM分类器,要使用该分类器,需要下载libsvm.jar并导入到Weka 中。 用"Explorer"打开数据集"iris.arff",并在Explorer中将功能面板切换到"Classif y"。点"Choose"按钮选择...
4 实验过程及结果 应用iris.arff数据集,分别采用LibSVM、C4.5决策树分类器和朴素贝叶斯分类器进行测试和评价,分别在训练数据上训练分类模型,找出各个模型最优的参数值,并对三个模型进行全面评价比较,
4实验过程及结果 应用iri.arff数据集,分别采用LibSVM、C4.5决策树分类器和朴素贝叶斯分类器进行测试和评价,分别在训练数据上训练分类模型,找出各个模型最优的参数值,并对三个模型进行全面评价比较,得到一个最
皮维卡使用 Python 脚本运行所有 Weka 分类器(CSV 到 ARFF 转换器、数据集缩放、多个类、格式化结果等) 使用 _Run_pyWeka.py 和 Params.csv 为 _Attributes.csv 中定义的多个数据集运行 _Classifiers4NormData.txt...
matlab开发-MatlabWekaInterface。WEKA分类器的matlab接口
演示如何使用java类更改分类器选项(类似于weka中的GenericObjectEditor) 3. 从 MATLAB 读取和写入 ARFF 文件4. 能够从 GUI 中选择属性以使用不同的输入组合进行测试4. 立即以图形方式显示结果5. 易于以图形方式...
Weka 的 OCCT 分类器实现####OCCT:用于实现一对多数据链接的一类聚类树######Abstract 一对多数据链接是许多领域的一项基本任务,但只有少数先前的出版物解决了这个问题。 此外,虽然传统上数据链接是在同一类型的...
目前,该项目支持分类/回归(任何Weka分类器)培训和评估,树冠聚类和关联规则学习。 分类/ reggresion类基于Mark Hall博士( )在将Weka移植到Hadoop方面的出色工作。 关联规则学习类基于分区算法的MapReduc
一个简单的脚本(基于http://www.mathworks.com/matlabcentral/fileexchange/21204-matlab-weka-interface ),它解释了如何用 70% 的数据集训练分类器并用其余数据集测试分类器的实例。
如果您复制并粘贴由weka GUI生成的分类器的配置,请确保删除“ C:\ Program Files \ Weka-XX”和相关标志,或者检查路径是否正确 有关更多信息: 我的第3节 如何使用: 到目前为止,该工具允许学习机器学习模型,...
评估分类器最初是为了在在线社交网络中的隐私领域进行研究而开发的。 有关更多详细信息,您可以阅读以下出版物: Abuelgasim,A.,Kayem,A .: 。 在:第二届国际信息系统安全和隐私会议(ICISSP)会议录,第126-...
派生或下载源文件,并将其包含在您最喜欢的IDE中的项目中,然后您可以构建自己的实验(请参阅参考资料)并实现自己的分类器。 概述 该代码库主要表示一个通用框架中不同算法的实现,这在当时尤其是一个真正的问题,...
对于分类,CSForest 使用原始论文中指定的 CSVoting。 安装 从 Weka 包管理器下载 CSForest,或者从 Github 侧边栏的“发布”部分下载最新版本。 编译/开发 在您选择的 IDE 中设置一个项目,包括作为编译时库的 weka...
它包括一组机器学习算法(分类,回归,聚类,离群值检测,概念漂移检测和推荐系统)和评估工具。 与WEKA项目相关,MOA也是用Java编写的,同时可以扩展到更苛刻的问题。 使用MOA MOA实时执行BIG DATA流挖掘,并进行...
【达摩老生出品,必属精品,亲测校正,质量保证】 资源名:matlab MRMR和relieff特征选择方法 资源类型:matlab项目全套源码 源码说明: 全部项目源码都是经过测试校正后百分百...适合人群:新手及有一定经验的开发人员
根据实验结果,所开发的算法在 33 个数据集上的平均分类准确率最高。 最高和最低的平均分类准确率分别为 89.80% 和 78.03%。 实验和实验结果中使用的数据集和算法已在链接 ( https://yadi.sk/d/g0A2RRhoGTrA1g ) ...