首页
登录 | 注册

数据清理 R语言

目录

1. R语言读excel文件

2.R格式 

3. #看数据集的格式

 


1. R语言读excel文件

1.       报错1: xlsx包没办法用

> library(xlsx)   #R语言使用xlsx包
载入需要的程辑包:rJava
Error: package or namespace load failed for ‘rJava’:
 loadNamespace()里算'rJava'时.onLoad失败了,详细内容:
  调用: fun(libname, pkgname)
  错误: JAVA_HOME cannot be determined from the Registry
Error: 无法载入程辑包‘rJava’
In addition: Warning messages:
1: 程辑包‘xlsx’是用R版本3.4.3 来建造的 
2: 程辑包‘rJava’是用R版本3.4.4 来建造的 


> library(rJava)
Error: package or namespace load failed for ‘rJava’:
 loadNamespace()里算'rJava'时.onLoad失败了,详细内容:
  调用: fun(libname, pkgname)
  错误: JAVA_HOME cannot be determined from the Registry
In addition: Warning message:
程辑包‘rJava’是用R版本3.4.4 来建造的 

   解决办法:用readxl包  可以参考博客【R语言读取Excel文件】 https://blog.csdn.net/cl1143015961/article/details/50035529

  对相关的包:RODBC、xlsx、openxlsx、gdata、readxl   进行了比较

2.R格式 

可以参考博客:http://blog.sina.com.cn/s/blog_6b36e6750100uad3.html

3. 看数据集的格式

      属于dplyr包  glimpse(BXdata)

结果:数据清理 R语言

4.  更改数据集列的格式

    从csv文件中导出来的每一列的属性都是factor,金额是每三位加一个逗号的格式。

BXdata[,1] = parse_date(BXdata[,1])  # 实现从factor转换为日期格式
BXdata[,5] = parse_number(BXdata[,5])  #实现从3,123,123.00这样的金额形式转化为double形式的数字

#可以用parse_character()将factor形式的文本转化为字符串格式,但是可能是encoding出了问题,最后结果会出现乱码,所以用as.charcter()这个函数。
BXdata[,3] =as.character(BXdata[,5])

数据清理 R语言

数据清理 R语言

最后,结果:

 

数据清理 R语言

笔记:as.character(data[,1])这样如果出现问题,可以考虑用下面这个来代替,可能会成功。具体是因为什么还需要再看看。

 as.character(data$费用)   #费用是第一列的变量名。



2020 jeepxie.net webmaster#jeepxie.net
10 q. 0.008 s.
京ICP备10005923号