现代应用统计

作者

黄湘云

发布于

2024年11月18日

前言

警告

Book in early development. Planned release in 202X.

本书分三大部分,分别是机器学习、贝叶斯建模和空间分析。三个部分分别依据任务类型、模型种类和数据类型展开,不同的写作出发点将呈现不一样的写作风格。应用机器学习首先需要确定任务类型,根据不同的任务选用不同的算法。贝叶斯建模从简单到复杂分频率和贝叶斯方法介绍主流的统计模型。应用空间分析方法需要根据空间数据类型(生成机理)而定,不同的生成机理将对应不同的建模和分析方法。机器学习根据任务类型分聚类、分类、回归和排序四个章节。贝叶斯建模根据模型种类分概率推理框架、线性模型、广义线性模型、分层正态模型、混合效应模型、广义可加模型、高斯过程回归、时间序列回归等八个章节。空间分析部分根据空间数据类型分点模式数据分析、点参考数据分析和区域数据分析三个章节。

环境信息

本书采用科学和技术写作排版系统 Quarto 编写,所有代码和文本混编在 qmd 格式的纯文本文件中,具有计算可重复性,即内含的 R 语言、Stan 语言和 Python 语言代码都可运行,并将计算结果插入到最终的文档中,本书使用的主要 R 包及版本信息如下:

xfun::session_info(packages = c(
  "mgcv", "glmnet", "lme4", "xgboost", "keras3", "tensorflow",
  "spaMM", "sf", "stars", "terra", "spdep", "igraph", "spatstat",
  "INLA", "cmdstanr", "rstan", "brms", "ggplot2", "patchwork",
  "knitr", "rmarkdown", "rsconnect", "magick", "pdftools"
), dependencies = FALSE)
R version 4.4.1 (2024-06-14)
Platform: x86_64-pc-linux-gnu
Running under: Ubuntu 22.04.5 LTS

Locale:
  LC_CTYPE=en_US.UTF-8       LC_NUMERIC=C              
  LC_TIME=en_US.UTF-8        LC_COLLATE=en_US.UTF-8    
  LC_MONETARY=en_US.UTF-8    LC_MESSAGES=en_US.UTF-8   
  LC_PAPER=en_US.UTF-8       LC_NAME=C                 
  LC_ADDRESS=C               LC_TELEPHONE=C            
  LC_MEASUREMENT=en_US.UTF-8 LC_IDENTIFICATION=C       

Package version:
  brms_2.22.0       cmdstanr_0.8.1    ggplot2_3.5.1     glmnet_4.1.8     
  igraph_2.1.1      INLA_24.6.27      keras3_1.2.0      knitr_1.49       
  lme4_1.1.35.5     magick_2.8.5      mgcv_1.9.1        patchwork_1.3.0  
  pdftools_3.4.1    rmarkdown_2.29    rsconnect_1.3.2   rstan_2.32.6     
  sf_1.0.19         spaMM_4.5.0       spatstat_3.2.1    spdep_1.3.6      
  stars_0.6.7       tensorflow_2.16.0 terra_1.7.83      xgboost_1.7.8.1  

Pandoc version: 3.4