R-studio数据可视化基础
第一章 数据可视化基础
1.1 变量可视化
1.1.1 Cirkeldiagram
作为第一步,我们必须计算我们想要可视化的分类变量的频率
根据此频率分布,可以使用pie()创建Cirkeldiagram:
在这里可以找到不同颜色的R-kod
http://www.stat.columbia.edu/~tzheng/files/Rcolor.pdf
1.1.2 条形图
1.1.3 直方图
直方图是离散的,但我们可以在R中直观地创建底层分布的估计值。
如果我们想要直方图上的绝对或相对比例,我们可以控制。 测试下面的代码。 两个图中的y轴有何不同? 哪个是freq参数的默认值?
1.2 几个变量的可视化
1.2.1 关系图
可视化二维数据的最常见方法之一是使用散点图。 我们现在将试图想象尼罗河水位的历史发展。
1.使用plot函数()创建常规散点图。 它是一个通用函数,在许多情况下我们使用图来可视化不同类型的对象。 测试方法(图)以查看plot()存在哪些方法。 但是,基本设计给出了如下散点图:
尼罗河的水位是时间序列而不是“常规”连接。 对于时间序列,我们通常希望使用折线图而不是单个点。 要更改为折线图,我们只指出type =“l”。
1.2.3 Boxplot
如果我们想根据分类变量比较不同的分布,我们用箱形图来做
第二章 Slumptal och simulering
2.1 密度函数
2.2 sample()和 set.seed()
如果我们想从许多元素中拖出随机数,我们使用sample函数()。 使用此功能,我们可以从给定的矢量绘制样本(有或没有重新加载)。 例如,如果我们想要使用return绘制1到10之间的5个随机值,我们在R中以下列方式这样做: