R读取含中文excel文件,read.xlsx乱码问题
最近在做一个汽车销售量的分析,在导入xlsx文件的时候总是出现乱码,因为本来就在excel里做了部分的数据清洗和整理,所以数据其实已经挺干净的,但就是会出现乱码
这是原始的数据表:
导入的时候使用xlsx.read
错误1:没有插入Encoding参数
文件中含有中文,但使用xlsx.read时不插入Encoding=UTF-8,会导致乱码
错误2:文件不是UTF-8的编码
文件的编码和encoding应该一致
更改excel文件的编码:
错误3:表格名为中文名
更改了错误1、2后,发现表格名也会影响
错误4:表格里面含有表格格式
在一开始的表当中,因为在Excel文件中为了好看,套用了表格格式
删除所有的格式只剩下值以后:
再一次使用read.xlsx()
没有乱码了…
总结一下,用R语言的xlsx包里面的read.xlsx( )导入含有中文的excel文件时,会因为以下问题出现乱码:
1.没有插入encoding的正确参数(一般为UTF-8)
2.文件的编码方式应该与encoding一致(因为Excel一般默认GB2312)
3.excel文件含有中文名
4.excel文件中含有表格格式