如何在weka中连接数据库
1)新建文件夹lib和文件夹weka,然后将mysql-connector-java-5.1.6-bin.jar复制到lib文件夹中
2)“我的电脑”属性,设置环境变量
新建变量WEKA_HOME=weka的安装目录,如(D:\Prgrams\weka-3.6)
在CLASSPATH变量中添加“;%WEKA_HOME%\lib\mysql-connector-java-5.1.6-bin.jar”
3)将weka.jar解压到weka文件夹(新建)中,然后进入weka\experiment,找到DatabaUtils.props(缺省使用)将其重新命名备份;假设我们要连接的mysql数据库,则将DatabaUtils.props.mysql重新命名为DatabaUtils.props,然后做如下修改:
# JDBC driver (comma-parated list)
#jdbcDriver=org.gjt.mm.mysql.Driver
修改为:jdbcDriver=com.mysql.jdbc.Driver
# databa URL,保持不变
jdbcURL=jdbc:mysql://rver_name:3306/databa_name ~
数据挖掘WEKA工具怎样来用来进行文本分类?有800多个测试文本,求大神给出具体的步骤和通俗易懂的
第一步,你要有中文的数据集;
第二步,数据集要准备成weka能处理的结构,这很好做到,你把数据集压缩了就行了,因为它要求的格式是,一个类别的文件放一个文件夹下。但是还有一个问题,你的机器往往没那么多内存去处理这个数据集,那么你可以选几个类别出来,在每个类别中放几十个文档来做就可以了。
第三步,分词。
第四步,使用weka wiki中的例子将数据集转换成arff格式。
weka是一种机器学习算法的集合,它可以用于分类,预测等。由于weka支持的数据格式是arff或csv的格式,因此在进行weka实验的时候必须进行数据的预处理。一般,我们可以在EXCEL里面导入TXT,然后另存为.CSV格式的文件(这个格式WEKA也是可以识别的),然后打开WEKA,–》TOOL–》 arffviewer中打开刚才的.CSV文件,另存为.arff就OK了!
如何学习在eclip工程中对weka算法的调用
eka是很好用的机器学习库,这里就不详细介绍了。
言归正传,要使用程序方式使用weka,步骤如下:
一、在eclip里新建一个java project:
1. 建立工程:单击菜单中file->new->java project,在弹出对话框的project name中起任意一个名字,此处假设是wekaTest。单击Finish按钮(在对话框底部)。
2. 建立package:在package Explorer中找到刚才新建的工程,在其上右键->New->package。在Name文本框里面输入名称,此处假设为Test。单击Finish按钮。
3. 建立程序文件:在刚才新建的package上面右键->New->class,选中public static void main(String[] args)多选框,单击Finish。
二、在该工程中添加weka的引用:
1. package Explorer中工程名上右键,选择弹出菜单最后一项properties->在左面选中java Build Path->在右面的Library页面->单击Add External JARs…->浏览weka所在目录,将weka.jar添加进来,然后单击ok。