`

Weka开发[8]- weka中算法说明

阅读更多

1) 数据输入和输出
WOW():查看Weka函数的参数。
Weka_control():设置Weka函数的参数。
read.arff():读Weka Attribute-Relation File Format (ARFF)格式的数据。
write.arff:将数据写入Weka Attribute-Relation File Format (ARFF)格式的文件。


2) 数据预处理
Normalize():无监督的标准化连续性数据。
Discretize():用MDL(Minimum Description Length)方法,有监督的离散化连续性数值数据。


3) 分类和回归
IBk():k最近邻分类
LBR():naive Bayes法分类
J48():C4.5决策树算法(决策树在分析各个属性时,是完全独立的)。
LMT():组合树结构和Logistic回归模型,每个叶子节点是一个Logistic回归模型,准确性比单独的决策树和Logistic回归方法要好。
M5P():M5 模型数算法,组合了树结构和线性回归模型,每个叶子节点是一个线性回归模型,因而可用于连续数据的回归。
DecisionStump():单层决策树算法,常被作为boosting的基本学习器。
SMO():支持向量机分类
AdaBoostM1():Adaboost M1方法。-W参数指定弱学习器的算法。
Bagging():通过从原始数据取样(用替换方法),创建多个模型。
LogitBoost():弱学习器采用了对数回归方法,学习到的是实数值
MultiBoostAB():AdaBoost 方法的改进,可看作AdaBoost 和 “wagging”的组合。
Stacking():用于不同的基本分类器集成的算法。
LinearRegression():建立合适的线性回归模型。
Logistic():建立logistic回归模型。
JRip():一种规则学习方法。
M5Rules():用M5方法产生回归问题的决策规则。
OneR():简单的1-R分类法。
PART():产生PART决策规则。


4) 聚类
Cobweb():这是种基于模型方法,它假设每个聚类的模型并发现适合相应模型的数据。不适合对大数据库进行聚类处理。
FarthestFirst():快速的近似的k均值聚类算法
SimpleKMeans():k均值聚类算法
XMeans():改进的k均值法,能自动决定类别数
DBScan():基于密度的聚类方法,它根据对象周围的密度不断增长聚类。它能从含有噪声的空间数据库中发现任意形状的聚类。此方法将一个聚类定义为一组“密度连接”的点集。


5)关联规则
Apriori():Apriori是关联规则领域里最具影响力的基础算法,是一种广度优先算法,通过多次扫描数据库来获取支持度大于最小支持度的频繁项集。它的理论基础是频繁项集的两个单调性原则:频繁项集的任一子集一定是频繁的;非频繁项集的任一超集一定是非频繁的。在海量数据的情况下,Apriori 算法的时间和空间成本非常高。
Tertius():Tertius算法。
6)预测和评估:
predict():根据分类或聚类结果预测新数据的类别
table():比较两个因子对象
evaluate_Weka_classifier():评估模型的执行,如:TP Rate,FP Rate,Precision,Recall,F-Measure。

分享到:
评论

相关推荐

    weka-3-8-6-azul-zulu-windows数据挖掘处理软件下载

    在 weka 中集成自己的算法甚至借鉴它的方法自己实现可视化工具并不是件很困难的事情。 Weka 基于 Java 开发,是一款开源且免费的软件,有 Windows 版本,Linux 版本和 Mac OS 版本。在数据源上支持 ARFF文件,这是一...

    weka-3-8-2

    weka作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。Weka is a collection of machine learning...

    weka-3-7-0

    weka-3-7-0可执行文件 用于数据挖掘 含有聚类,分类等功能

    Weka实验----数据挖掘算法学习

    总所周知,Weka是数据挖掘算法学习的非常好的工具,附件为Weka的实验,看看你对Weka掌握的怎么杨,也可以通过实验学习Weka及算法。 本附件是下载自国外的网站,学习交流用,严禁用于商业,后果概不负责。

    weka-3-8-3-x64.exe

    weka有带java环境和不带java环境的版本,这是不带jre的版本。 Weka使机器学习的应用变得简单、高效并且充满乐趣。它拥有图形界面,并且允许你加载自己的数据集,运行算法并且产生足够可靠、让人信服的结果。

    weka源码学习

    Weka开发[-1]——在你的代码中使用Weka 51 挖掘多标签数据综述(multi-label data mining)[Available] 62 数据流-移动超平面(HyperPlane)构造 63 Weka开发[17]——关联规则之Apriori 66 Weka开发[18]——寻找K...

    weka-3-8-3jre-x64.rar

    Weka 机器学习软件解决数据挖掘问题 Weka是解决现实世界数据挖掘问题的机器学习算法的集合。它是用Java编写的,几乎可以在任何平台上运行。这些算法既可以直接应用于数据集,也可以从您自己的Java代码中调用。

    weka-dev-3.7.10.jar

    Java weka包,提供arff文件操作和诸多聚类分类算法等。 其实网上有很多相关的教程,从如何下载weka包,到如何使用,都有很详细的说明,这里上传上来以方便使用。

    使用Weka进行K-近邻算法和K-均值算法的使用-附件资源

    使用Weka进行K-近邻算法和K-均值算法的使用-附件资源

    Weka中各种分类算法和聚类算法集成

    本工具包集成了Weka中最新的分类和聚类算法,将其打包成jar包,方便java开发者调用

    Weka-3-8-5.rar

    weka平台,一个专业进行数据挖掘的软件,,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。

    weka-3-6-6

    weka作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联...在weka中集成自己的算法甚至借鉴它的方法自己实现可视化工具并不是件很困难的事情

    weka-3-9-1jre-x64.exe

    WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。2005年8月,在第11届ACM SIGKDD国际会议上...

    weka中K-means使用演示

    聚类分析算法K-means在weka下使用方法

    weka-3-6运行libsvm方法

    weka3.6运行libsvm,需要将wlsvm.jar和libsvm.jar文件拷贝到WEKA的安装路径下,然后修改RunWeka.ini文件中的cmd_dafault路径,还含有相关内容的路径检索!

    weka 中em算法详细解析

    详细讲述了weka中EM算法解析,清晰,值得学习

    weka-3-7-1

    一款非常有名的数据玩具工具,集成数据挖掘领域各种有名的算法,如C4.5,KNN等等,可以用数据库领域的研究与科研。

    weka-3-6-12jre.exe

    机器学习java工具,以及使用方法,包含各种机器学习算法工具

Global site tag (gtag.js) - Google Analytics