数据框,类似于数据库表或Excel数据表,可以通过函数data.frame()创建。
将向量、列表、矩阵转换成数据框可以使用as.data.frame(x)。
在创建数据框时,可以通过设置选项stringsAsFactors=FALSE来避免将字符型列转换为因子。
如果数据框的某一列为常数,可以在data.frame()调用中只给该列赋一个值,生成的结果会自动重复这个值,使得该列与其他列等长。
可以使用nrow(d)来获取数据框d的行数,ncol(d)或length(d)来获取列数。
names(d)或colnames(d)可以用于访问或修改列名。
数据框可以用矩阵格式访问,例如访问单个元素或第二列,结果为向量。
为了提取一列为向量,应使用双方括号格式或$格式,不应使用tibble。
或者使用attach和detach,可以直接用变量名而不需要使用$。
按列名访问列的方式如下。
可以同时获取行子集和列子集。
tibble是一种改进的数据框。readr包的read_csv()函数是read.csv()函数的一个改进版本,它将CSV文件读入为tibble类型。
使用as_tibble()可以将一个数据框转换为tibble。
dplyr包提供了filter()、select()、arrange()、mutate()等函数,用于对tibble选取行子集、列子集,排序、修改或定义新变量。
使用tribble()可以按类似于CSV格式输入一个tibble。
read_csv()也支持从一个多行字符串直接读入数据。
温馨提示:内容为网友见解,仅供参考