R 语言数据分析实战

作者

统计之都团队

发布日期

2023年1月25日

欢迎

警告

Book in early development. Planned release in 2024.

本书初稿是在 RStudio IDE 内使用 Quarto 编辑的,Quarto 是继R Markdown之后,一个新的开源的科学和技术发布系统,它基于 Pandoc支持输出多种格式的书稿,比如 HTML 网页、EPUB 电子书、DOCX 文档和 PDF 便携式文档等。Quarto 吸收了过去 10 年 R Markdown 取得的经验和教训,在书籍写作、创建博客、制作简历和幻灯片等系列场景中支持更加统一的使用语法,一份源文档输出多种格式,使文档内容在不同场景中的迁移成本更低。了解更多 Quarto 特性,请访问 https://quarto.org/

书中的代码字体采用美观的 Source Code Pro 字体, 为方便跨操作系统编译书籍电子版,正文的中文字体采用开源的 fandol 字体。而本书图形中使用的 Noto 系列中英文字体来自 Google Fonts 字体库,分别是 Noto Sans 无衬线英文字体和 Noto Serif SC 宋体中文字体。

注释

为方便测试贡献者提供的 PR,本书托管在 Github 上,同时启用 Github Action 服务。书中使用的 Noto 系列字体来自 Google 字体网站,国内可能无法访问,但为了尽可能减少可重复的成本,保持书籍能够在 MacOS、Windows 和 Linux 等系统上顺利编译,字体要尽可能便携易得。此外,考虑到美观性,以及避免仓库中附带字体可能带来的权限问题,因此,在绘图程序中使用了 Noto 字体。

书中 R 包名以粗体表示,如 knitr 包,函数名以等宽体表示,如 plot(),函数的参数名同理。代码块内注释用 # 表示,运行结果每一行开头以 #> 标记。本书写作过程中,依赖 knitr (Xie 2015)ggplot2 (Wickham 2016)lattice (Sarkar 2008) 等众多 R 包。考虑到要同时支持 DOCX、EPUB、PDF 和 HTML 四种书籍格式,书中使用 knitr 包和 gt 包制作静态的表格。

本书源码托管在 Github 上,基于 Github Action 提供的测试环境,为书籍自定义了一个可复现全书内容的运行环境,包括 R 软件、扩展包和系统软件依赖,详见仓库中的 DESCRIPTION 文件。你现在看到的是在线编译版本,最新一次编译时间是 2023-01-25 23:53:51。

xfun::session_info(packages = c(
  "ggplot2", "gganimate", "ggrepel", "ggraph",
  "ggridges", "ggsignif", "ggforce", "ggdensity",
  "ggbeeswarm", "ggeffects", "ggnewscale",
  "patchwork", "geomtextpath", "ggalluvial",
  "plotly", "rgl", "echarts4r", "scatterplot3d",
  "dplyr", "purrr", "tidyr", "data.table",
  "quarto", "knitr", "rmarkdown", "gt", "lattice",
  "cmdstanr", "glmnet", "lme4", "sf", "stars",
  "showtext", "gifski", "tinytex", "magick"
), dependencies = FALSE)
R version 4.2.2 (2022-10-31)
Platform: x86_64-pc-linux-gnu (64-bit)
Running under: Ubuntu 22.04.1 LTS

Locale:
  LC_CTYPE=en_US.UTF-8       LC_NUMERIC=C              
  LC_TIME=en_US.UTF-8        LC_COLLATE=en_US.UTF-8    
  LC_MONETARY=en_US.UTF-8    LC_MESSAGES=en_US.UTF-8   
  LC_PAPER=en_US.UTF-8       LC_NAME=C                 
  LC_ADDRESS=C               LC_TELEPHONE=C            
  LC_MEASUREMENT=en_US.UTF-8 LC_IDENTIFICATION=C       

Package version:
  cmdstanr_0.5.3       data.table_1.14.6    dplyr_1.0.10        
  echarts4r_0.4.4      geomtextpath_0.1.1   ggalluvial_0.12.3   
  gganimate_1.0.8      ggbeeswarm_0.7.1     ggdensity_0.1.1     
  ggeffects_1.1.4      ggforce_0.4.1        ggnewscale_0.4.8    
  ggplot2_3.4.0        ggraph_2.1.0         ggrepel_0.9.2       
  ggridges_0.5.4       ggsignif_0.6.4       gifski_1.6.6.1      
  glmnet_4.1.6         gt_0.8.0             knitr_1.42          
  lattice_0.20.45      lme4_1.1.31          magick_2.7.3        
  patchwork_1.1.2      plotly_4.10.1        purrr_1.0.1         
  quarto_1.2           rgl_1.0.1            rmarkdown_2.20      
  scatterplot3d_0.3.42 sf_1.0.9             showtext_0.9.5      
  stars_0.6.0          tidyr_1.3.0          tinytex_0.43        

Pandoc version: 2.19.2

LaTeX version used: 
  TeX Live 2022 (TinyTeX) with tlmgr 2022-04-18