前言

2014年,我有幸获得新西兰坎特伯雷大学(School of Forestry, University of Canterbury)林学院全额奖学金资助,来到新西兰开始攻读博士学位,在此之前从未了解过R语言软件,我的主要研究方向为利用红外光谱数据进行林木重要性状的预测建模,并利用构建的预测模型,对大样本林木主要性状进行高通量快速预测,最终进行遗传选择研究。当时我的导师推荐我使用R语言软件进行数据分析,但是那时候真的是一头雾水,不知道如何学起,甚至连软件怎么安装都看不懂,导师提供了一些有用的网站与资料让我参考,但是没有时间教我怎么用R,所以一切只能靠自己学,截止到现在,我在R语言的学习中已经度过了6个年头,这6年来,从一无所知到现在稍微了一定的认知,经历了不少痛苦和弯路,对于初学者来说,我能深刻体会到初学者的那种迷茫和痛苦,因此,我就萌生了写这本书的念头,虽然我对R的理解可能跟国内外R语言大神们来说还是比较浅薄,但是在光谱建模这方面我还是有了一定的心得,因此,我想总结梳理一下我所学到的在光谱数据分析时所有知识,旨在为以后可能接触光谱学模型构建的同学们提供一定的参考,本书将着重在数据整理、数据预处理、数据拆分和数据建模等方面进行讲解,通过大量实例,来为大家系统讲解,这本书可能不会包含太多纯理论性的内容,因为很多时候你不需要懂太多深层次的东西,就可以实现数据分析。如果想更多了解模型算法,请同时参考其他更专业的书籍。 本书的主要目的是为了告诉大家怎么样使用R语言软件处理植物光谱数据,结合机器学习构建预测或判别模型、模型预测以及数据可视化,并结合大量实例为大家演示。

R软件安装

要开始使用R软件,首先需要下载R软件,R软件完全免费,你可以很容易的下载R,根据你的电脑系统选择相应的版本。下载安装好R软件以后,打开R软件,你会发现R界面比较原始,不知如何开始。这时候还有一个重要的软件会让你一目了然,那就是R studio,这是一个增强R软件用户交互界面的软件,非常人性化并且也是免费的。进入链接后,选择下载R studio desktop 免费版即可。 当你安装好R studio,以后你就不用打开R软件了,每次直接打开R studio就可以进行操作,因为R studio 是基于R软件而进行运算的,所以每次打开R studio,系统会默认打开了R软件,好了,在接下来的章节我们就将由简入深的感受R语言的魅力。

我的 R 进程信息:

sessionInfo()
## R version 4.0.1 (2020-06-06)
## Platform: x86_64-apple-darwin17.0 (64-bit)
## Running under: macOS Catalina 10.15.5
## 
## Matrix products: default
## BLAS:   /Library/Frameworks/R.framework/Versions/4.0/Resources/lib/libRblas.dylib
## LAPACK: /Library/Frameworks/R.framework/Versions/4.0/Resources/lib/libRlapack.dylib
## 
## locale:
## [1] en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8
## 
## attached base packages:
## [1] stats     graphics  grDevices utils     datasets 
## [6] methods   base     
## 
## other attached packages:
## [1] showtext_0.8-1 showtextdb_3.0 sysfonts_0.8.1
## 
## loaded via a namespace (and not attached):
##  [1] Rcpp_1.0.4.6    bookdown_0.19   digest_0.6.25  
##  [4] magrittr_1.5    evaluate_0.14   rlang_0.4.6    
##  [7] stringi_1.4.6   rmarkdown_2.2   tools_4.0.1    
## [10] stringr_1.4.0   xfun_0.14       yaml_2.2.1     
## [13] compiler_4.0.1  htmltools_0.4.0 knitr_1.28

致谢

我会在最后写这一块儿,毕竟现在只有我一个人在写这本书。

李彦杰
写于新西兰一个村
2020年03月13日