前言

本书说明

  • 此电子书是关于R数据分析的简单介绍,希望它能帮助大家:
    • 读懂R代码
    • 掌握基本的R代码编写
    • 使用R读取和处理数据
    • 使用R进行数据可视化
    • 使用R进行常规的统计分析

软件安装

  • 在开始学习前,请先安装R与RStudio:
    1. R下载链接:点击任意站点,进入后,选择下载与操作系统匹配的R软件。

    2. RStudio下载链接

注意
  • 编写R代码时,所有的代码符号均为英文标点符号。
  • #是R中的注释符(快捷键为Shift+Ctrl+c),运行时不会执行#这一行的代码,通常被用作代码注释或者特定代码的测试
  • 在控制台(Console)输入 ?+函数 可以获取函数的详细介绍。
  • 练习题链接

    RStudio界面

    打开RStudio,我们通常会看到如上图所示的界面。

    界面1为脚本界面,我们将在这里写代码。如果这个界面没有出现,可以点击左上角2按键,选择R Script(快捷键为Ctrl+Shift+n)创建。在脚本界面中,如果我们想要运行特定一行的代码,可以把光标放在该行代码的任意位置,然后按右侧的Run3按键(快捷键为Ctrl+Enter)。如果要运行多行代码,则需要先用鼠标选中所有要运行的代码,然后再按Run按键。

    界面4为控制台界面,代码运行的结果或者提示信息将会在这里显示。如果想运行单行指令,也可以在这里快速输入。注意,每次回车后,该行指令将被运行。当界面中信息过多时,可以点击右上角的扫帚符号5进行清空。

    界面6为数据展示界面,它展示当前载入或生成的数据等信息。当需要查看数据框[小节6]时,可以点击对应的数据框名称,这时在界面1中会显示该数据框的内容。此外,在界面4中输入对应的数据名称时,也可以显示数据内容。

    界面7的Files选项卡显示当前工作路径下的文件。当利用R作图时,Plots选项卡将显示图像。Pakcages选项卡显示已安装的R包,我们可以在其中查找和选择特定的包并进行升级。

    R包的安装

    R之所以广受欢迎,很大一个原因就是它拥有种类繁多的“包”以满足我们的多种需求。尽管R自带一些功能强大的“包”,但是我们在需要的时候还得额外安装“包”,否则,调用包就会报错。

    这时就需要用到install.packages()函数。例如,当我们需要安装tidyverse包时,可以输入install.packages("tidyverse")

    R包的调用

    我们如果需要使用某一个“包”,则需要在开始时使用library()函数调用它。例如,我们在安装完tidyverse包后,调用它时可以输入 library(tidyverse)

    有时我们会在一个项目中调用多个包,而有些包里的函数会出现重名的情况,这时,后调用的“包”将覆盖先前加载“包”的功能。如果我们需要使用特定包的某个重名函数,可以输入包::函数。例如tserieschron包都含有is.weekend()函数,如果要调用chron包的is.weekend()函数,则可以写成chron::is.weekend()

    当我们不清楚某个“包”是否有安装,可以使用if (!require(包)){install.packages("包")},这个代码的含义是,检查特定的包是否存在,如果不存在,将安装它。比如,检查tidyverse包是否存在,如果不存在则安装它,可以写成 if (!require(tidyverse)){install.packages("tidyverse")}