现代应用统计

作者

黄湘云

发布于

2026年1月12日

前言

警告

Book in early development. Planned release in 202X.

本书分三大部分，分别是机器学习、贝叶斯建模和空间分析。三个部分分别依据任务类型、模型种类和数据类型展开，不同的写作出发点将呈现不一样的写作风格。应用机器学习首先需要确定任务类型，根据不同的任务选用不同的算法。贝叶斯建模从简单到复杂分频率和贝叶斯方法介绍主流的统计模型。应用空间分析方法需要根据空间数据类型（生成机理）而定，不同的生成机理将对应不同的建模和分析方法。机器学习根据任务类型分聚类、分类、回归和排序四个章节。贝叶斯建模根据模型种类分概率推理框架、线性模型、广义线性模型、分层正态模型、混合效应模型、广义可加模型、高斯过程回归、时间序列回归等八个章节。空间分析部分根据空间数据类型分点模式数据分析、点参考数据分析和区域数据分析三个章节。

环境信息

本书采用科学和技术写作排版系统 Quarto 编写，所有代码和文本混编在 qmd 格式的纯文本文件中，具有计算可重复性，即内含的 R 语言、Stan 语言和 Python 语言代码都可运行，并将计算结果插入到最终的文档中，本书使用的主要 R 包及版本信息如下：

xfun::session_info(packages = c(
  "mgcv", "glmnet", "lme4", "xgboost", "keras3", "tensorflow",
  "spaMM", "sf", "stars", "terra", "spdep", "igraph", "spatstat",
  "INLA", "cmdstanr", "rstan", "brms", "ggplot2", "patchwork",
  "knitr", "rmarkdown", "rsconnect", "magick", "pdftools"
), dependencies = FALSE)

R version 4.5.1 (2025-06-13)
Platform: x86_64-pc-linux-gnu
Running under: Ubuntu 24.04.3 LTS

Locale:
  LC_CTYPE=en_US.UTF-8       LC_NUMERIC=C              
  LC_TIME=en_US.UTF-8        LC_COLLATE=en_US.UTF-8    
  LC_MONETARY=en_US.UTF-8    LC_MESSAGES=en_US.UTF-8   
  LC_PAPER=en_US.UTF-8       LC_NAME=C                 
  LC_ADDRESS=C               LC_TELEPHONE=C            
  LC_MEASUREMENT=en_US.UTF-8 LC_IDENTIFICATION=C       

Package version:
  brms_2.23.0       cmdstanr_0.9.0    ggplot2_4.0.1     glmnet_4.1.10    
  igraph_2.2.1      INLA_25.10.19     keras3_1.5.0      knitr_1.51       
  lme4_1.1.38       magick_2.9.0      mgcv_1.9.3        patchwork_1.3.2  
  pdftools_3.6.0    rmarkdown_2.30    rsconnect_1.7.0   rstan_2.32.7     
  sf_1.0.23         spaMM_4.6.1       spatstat_3.5.0    spdep_1.4.1      
  stars_0.7.0       tensorflow_2.20.0 terra_1.8.86      xgboost_3.1.2.1  

Pandoc version: 3.6.3