方法/步骤
打开Access程序,点击Access左上角按钮,并选择打开。
在打开窗口里找到CSV所在文件夹路径,并在窗口下方文件类型中选择“文本文件(*.txt;*.csv;*.tab;*.asc)”,选择完成后便可以看到要转换的CSV文件了——鼠标点击选中它——点击右下角打开。
在弹出的“链接文本向导”中,选择“带分隔符...”,并点击高级选项。
在高级选项卡“代码页”选项中,选择“UTF-8”,然后点击确定。
可以看到原本乱码的文件转成简体中文了,点击下一步。
字段分割符选择“逗号”,点击下一步。
字段名称,即每列列头,如无更改需要直接点击下一步。
单击完成按钮,弹出成功创建连接表文件提示框。
如图所示,右键点击刚刚创建的链接表,然后点击导出中的Excel
在弹出的窗口中选择导出文件的保存路径及保存格式,并勾选如图所示两项。
系统会为你打开刚刚你所转换的Excel,查看下是不是已经转换完成了呢。
就是你的csv第三行,本来要读取30个值,结果值读取了3个值。可能的原因是:csv为逗号分隔的文件,可能(1)你的内容中包含逗号(2)有些转换后出现了非正常换行,即本行未结束提前换行。请检查一下文件第三行附近的几行,是不是正常。如果没有问题,考虑其中的文字是否有非法字符,日语等字符是识别不出来的,会报错。
这是由于设置不当导致的。
解决办法:
属性名字要求不同,最好都改成英文的。
看看数据是不是整齐的(矩形的),有时候有空格单元格会有干扰。
设置的属性名有重名的,修改一下就好了。
Weka的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),是一款免费的,非商业化(与之对应的是SPSS公司商业数据挖掘产品--Clementine )的,基于JAVA环境下开源的机器学习(machine learning)以及数据挖掘(data minining)软件。