上一次最后的结果就是一个分类的值,可能让大家大失所望,这一次会给大家一个比较完美的答案,这就是Evaluation类,这次只讲一下最简单的用法,首先初始化一个Evaluation对象,Evaluation类没有无参的构造函数,一般用Instances对象作为构造函数的参数。
如果没有分开训练集和测试集,可以使用Cross Validation方法,Evaluation中crossValidateModel方法的四个参数分别为,第一个是分类器,第二个是在某个数据集上评价的数据集,第三个参数是交叉检验的次数(10是比较常见的),第四个是一个随机数对象。
如果有训练集和测试集,可以使用Evaluation 类中的evaluateModel方法,方法中的参数为:第一个为一个训练过的分类器,第二个参数是在某个数据集上评价的数据集。例中我为了简单用训练集再次做为测试集,希望大家不会糊涂。
提醒大家一下,使用crossValidateModel时,分类器不需要先训练,这其实也应该是常识了。
Evaluation中提供了多种输出方法,大家如果用过weka软件,会发现方法输出结果与软件中某个显示结果的是对应的。例中的三个方法toClassDetailsString,toSummaryString,toMatrixString比较常用。
package com.cizito.weka.study; import java.util.Random; import weka.classifiers.Evaluation; import weka.classifiers.lazy.IB1; import weka.classifiers.trees.J48; import weka.core.Instances; import weka.core.converters.ConverterUtils.DataSource; /** * @author zhangwei * */ public class EvaluationTest { private Instances m_instances = null; /** * @param args */ public static void main(String[] args) throws Exception{ EvaluationTest etest = new EvaluationTest(); etest.getFileInstances( "D:/ProgramFiles/Weka-3-6/data/contact-lenses.arff"); //etest.crossValidation(); //System.out.println( "***********************************\n\n" ); etest.evaluateTestData(); } public void getFileInstances( String fileName ) throws Exception { DataSource frData = new DataSource( fileName ); m_instances = frData.getDataSet(); m_instances.setClassIndex( m_instances.numAttributes() - 1 ); } public void crossValidation() throws Exception { J48 classifier = new J48(); //NaiveBayes classifier = new NaiveBayes(); //SMO classifier = new SMO(); Evaluation eval = new Evaluation( m_instances ); eval.crossValidateModel( classifier, m_instances, 10, new Random(1)); System.out.println(eval.toClassDetailsString()); System.out.println(eval.toSummaryString()); System.out.println(eval.toMatrixString()); } public void evaluateTestData() throws Exception { //J48 classifier = new J48(); IB1 classifier = new IB1(); //NaiveBayes classifier = new NaiveBayes(); //SMO classifier = new SMO(); classifier.buildClassifier( m_instances ); Evaluation eval = new Evaluation( m_instances ); eval.evaluateModel( classifier, m_instances ); System.out.println(eval.toClassDetailsString()); System.out.println(eval.toSummaryString()); System.out.println(eval.toMatrixString()); } }
相关推荐
Weka-3-6.zip
Weka 基于 Java 开发,是一款开源且免费的软件,有 Windows 版本,Linux 版本和 Mac OS 版本。在数据源上支持 ARFF文件,这是一种 ASCII 文本文件,CSV 文件和 JDBC 数据库访问功能。 Weka 轻巧便捷,安装简单,非常...
weka作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。Weka is a collection of machine learning...
全称为新西兰怀卡托智能分析环境,用JAVA实现数据挖掘的各种技术,包括分类,聚类,关联规则等
weka-3-7-0可执行文件 用于数据挖掘 含有聚类,分类等功能
weka-3-8-4-azul-zulu-windows
weka-3-8-5-azul-zulu-windows
包括weka-3-7-9jre软件以及相关的安装流程文档,另外包括libsvm相关包和集成流程文档
Weka开发----在代码中使用Weka.pdf
weka-3-8-5-azul-zulu-windows.exe
weka-3-7-12
这是个数据挖掘常用的工具 能使你进行数据分析的效率显著提高 并且简单易用
Data Mining Software in Java
weka-3-4-4版本 蛮好的一种weka软件
weka-3-6-12中的libsvm库安装配置,包含weka-3-6-12.jre.exe,libsvm.jar,wlsvm.jar和安装配置文档
Weka软件,里面自带了Java.Weka是一款用Java开发的开源的数据挖掘软件。该软件方便好用
weka安装包(非最新版本),也可去官网自行下载 (软件开源,官网:http://www.cs.waikato.ac.nz/ml/weka/)
weka-3-8-5mac安装文件
weka-3-8-2下载exe