R-数据结构(综述)-3

在R中,创建数据集分为两步:
1.选择一种数据结构来存储
2.将数据输入或导入这个数据结构中

数据集的概念
数据集通常是数据构成的矩形数组,行用来观测,列表示变量。

数据结构
R中有很多用于存储的数据结构,包括标量,向量,数组,数据框,列表。R可以处理数据类型包括数值型,字符型,逻辑型,复数型(虚数)和原生型(字节)。
R-数据结构(综述)-3

R中有一些术语较为独特,可能会对新用户造成困扰。

在R中,对象(object)是指可以赋值给变量的任何事物,包括常量、数据结构、函数, 甚至图形。对象都拥有某种模式,描述了此对象是如何存储的,以及某个类,像print这样的 泛型函数表明如何处理此对象。
与其他标准统计软件(如SAS、SPSS和Stata)中的数据集类似,数据框(data frame)是R 中用于存储数据的一种结构:列表示变量,行表示观测。在同一个数据框中可以存储不同类型 (如数值型、字符型)的变量。数据框将是你用来存储数据集的主要数据结构。
因子(factor)是名义型变量或有序型变量。它们在R中被特殊地存储和处理。你将在2.2.5 节中学习因子的处理。 其他多数术语你应该比较熟悉了,它们基本都遵循统计和计算中术语的定义