`
文章列表
问题一、String,StringBuffer,StringBuilder的区别?        String:字符串常量;        StringBuffer:字符串变量(线程安全)        StringBuilder:字符串变量(非线程安全)        速度一般情况下:StringBuilder > StringBuffer > String        速度区别的主要原因是由于String是不可变的对象,每次针对的String对象的改变都是生成新的String对象,然后将指针指向新生成的对象。这样系统中无引用的String实例越来越多,增加GC的次 ...
ArrayList 和Vector是采用数组方式存储数据,此数组元素数大于实际存储的数据以便增加和插入元素,都允许直接序号索引元素,但是插入数据要设计到数组元素移动等内存操作,所以索引数据快插入数据慢,Vector由于使用了synchronized方法(线程安全)所以性能上比ArrayList要差,LinkedList使用双向链表实现存储,按序号索引数据需要进行向前或向后遍历,但是插入数据时只需要记录本项的前后项即可,所以插入数度较快!线性表,链表,哈希表是常用的数据结构,在进行Java开发时,JDK已经为我们提供了一系列相应的类来实现基本的数据结构。这些类均在java.util包中。本文试 ...
  异常:Lock wait timeout exceeded; try restarting transaction解决办法: 执行select * from information_schema.innodb_trx 之后找到了一个一直没有提交的只读事务, 找到对应的线程后,执行 kill thread id,再确认一直没有提交的只读事物被干掉了就OK了。
在几千条记录里,存在着些相同的记录,如何能用SQL语句,删除掉重复的呢? 1、查找表中多余的重复记录,重复记录是根据单个字段(peopleId)来判断select * from peoplewhere peopleId in (select  peopleId  from  people  group  by  peopleId  having  count(peopleId) > 1) 2、删除表中多余的重复记录,重复记录是根据单个字段(peopleId)来判断,只留有rowid最小的记录delete from people where peopleId  in (selec ...
1) 数据输入和输出WOW():查看Weka函数的参数。Weka_control():设置Weka函数的参数。read.arff():读Weka Attribute-Relation File Format (ARFF)格式的数据。write.arff:将数据写入Weka Attribute-Relation File Format (ARFF)格式的文件。 2) 数据预处理Normalize():无监督的标准化连续性数据。Discretize():用MDL(Minimum Description Length)方法,有监督的离散化连续性数值数据。 3) 分类和回归IBk():k最近邻分类 ...
这次介绍一下Id3源码,这次用Weka的源码介绍一下。首先Id3是继承于Classifier的:        public class Id3 extends Classifier
一、先说一说subString()函数        subString函数有个陷阱,有可能导致内存泄露(当然,在JDK1.7.0-B147之前这个问题一直存在,在JDK1.7.0_15-b03版本之后这个问题已经修改过来了,至于是具体中间哪个版本修改过来的,本人没有去细看)        在Java中,字符串是很复杂的一个问题,java有对字符串的优化,比如String POOL 对于SubString这个问题上, java也有自己的想法,比如            String oldStr = "hello,clark"; String newStr ...
     转载杨尚川老师的一篇博客:http://yangshangchuan.iteye.com/blog/1837935      Nutch是一个Java开源项目,拥有近十年的历史,从一开始的搜索引擎演变为如今的网络爬虫。在Nutch的进化过程中,产生了Hadoop、Tika和Gora三个Java开源项目。如今这三个项目都发展迅速,极其火爆,尤其是Hadoop,其已成为大数据和云计算的代名词。     本人拥有多年Nutch相关框架研发经验,顺应大数据云计算的浪潮,推出了国内首套免费
————转载于欧冠联赛2012-2013赛季皇家马德里客场2:3负于加拉塔萨雷之后。  埃布埃和许多不知名球员一样,爱岗敬业,尽心尽力干着本职工作。即便偶尔出彩,也会被好出风头的高调同僚抢走头功。但他们绝不抱怨什么,也不会争要什么,而是极热诚地投入到下一阶段的工作中。                     一个非著名足球运动员,人们往往只能记住他们的“段子”,而不是他们的“进球” 看到标题党们大谈斯内德和德罗巴这帮老男人几乎得手的“地狱逆袭”,将之取名为《德罗巴斯内德让皇马窒息》。对于首回合大比分落败的加拉塔萨雷而言,自己犹如一具垂死的僵尸。而这一“大波”僵尸在暗夜之中发动的 ...
       首先要提的是LibSVM是一个库,Lib很明显是library的缩写,有些人不知道怎么会认为它是一种算法。它是由中国台湾的,记住是中国的台湾(⊙o⊙)…,Chih-Chung Chang和Chih-Jen Lin等人开发的,他们用多种语言实现写了LibSVM。        我把这一篇放到Weka开发里讲,主要讲它怎么和Weka结合,Weka中并不是没有
      这一次介绍的非常简单,会用传命令行参数的人就不用浪费时间看这一篇了,这一篇介绍weka中一些类参数传递的问题。       首先要传递参数当然要知道参数有哪些,有什么作用,要知道这些,建议用Weka软件就好了,在源码中看也不是不可以,但请记住简单的就是最好的(Occam’s Razor)。以下的图就是打开的以J48为例的界面(不知道怎么打开以下界面的,回家面壁思过),对话框里当然就是可选的参数,如果都不了解是什么意思,点击More按钮看解释。   J48,如果没有看到相应的源码,请再次面壁思过,这时就有参数的介绍:  * -U  *  Use unpruned tr ...
     特征选择,理论上和实际上理论上和实际上使用特征选择之后进行分类比不进行特征选择的正确率都差,那么特征选择的意义又何在呢?与一位网友讨论的结果是:有些特征的提取可没那么容易,也会带来计算效率问题。如果不进行特征选择直接进行分类的话计算效率有可能不能接受,所以可以事先使用部分数据进行特征选择。那么显然我们要权衡的就是:特征选择带来的正确率下降和不选择有可能带来的效率问题哪个更不能被接受。        大概讲一下,用AttributeSelection进行特征选择,它需要设置3个方面,第一:对属性评价的类(自己到Weka软件里看一下,英文Attribute Evaluator),第二 ...
     上一次最后的结果就是一个分类的值,可能让大家大失所望,这一次会给大家一个比较完美的答案,这就是Evaluation类,这次只讲一下最简单的用法,首先初始化一个Evaluation对象,Evaluation类没有无参的构造函数,一般用Instances对象作为构造函数的参数。        如果没有分开训练集和测试集,可以使用Cross Validation方法,Evaluation中crossValidateModel方法的四个参数分别为,第一个是分类器,第二个是在某个数据集上评价的数据集,第三个参数是交叉检验的次数(10
     这次介绍如何利用weka里的类对数据集进行分类,要对数据集进行分类,第一步要指定数据集中哪一列做为类别,如果这一步忘记了(事实上经常会忘记)会出现“Class index is negative (not set)!”这个错误,设置某一列为类别用Instances类的成员方法setClassIndex,要设置最后一列为类别则可以用Instances类的numAttributes()成员方法得到属性的个数再减1

SQL批量update

两张表,table1(name,id),table2(name,id),两张表的区别是对相同的name分配的id是不同的,现在想更新table1的id,使之和table2的一致,怎么样批量更新? 参考答案:update table1 aset id=(select id from table2 where name=a.name)where exists(select 1 from table2 where name=a.name) ;UPDATE table1 SET table1.id=table2.id FROM table1 INNER JOIN table2 ON tabl ...
Global site tag (gtag.js) - Google Analytics