12.1 WDI

World Devevlopment Indicators(WDI)是世界银行提供的公开、高质量数据库。指标首先按照领域分类,除了一般常见的统计数据外,还包括农业、气候、贫穷、健康方面的数据。

Indicators divided by sectors

Figure 12.1: Indicators divided by sectors

具体到某领域内,每个数据集都是各个国家在某个指标上的时间序列,时效性一般在两年之内。下面是气候变化分类中电力覆盖率指标(Access to electricity)的一个例子:

数据库中包含了超过 1600 个这样的时间序列,很多有效跨度超过了 50 年。WDI(Arel-Bundock 2019) 包提供了在 WDI 数据库中搜索、提取、格式化信息的接口。

12.1.1 WDIsearch()

WDIserach() 用于在 WDI 数据库中搜索可用的指标,是之后用 WDI() 提取相关数据的基础。

  • string = "gdp": 用于搜索的正则表达式
  • field= “name”: 搜索域,可选 “indicator”(编码)、“name”(名称)、“discription”(详细描述)、“sourceDatabase” 和 “sourceOrganization” (来源数据库或组织)
  • short = TRUEWDIsearch()默认只返回匹配指标的编码和名称,short = FSLE 同时返回详细描述和来源

如在名称域内中搜索与二氧化碳相关的指标:

改变搜索域:

WDIsearch() 中的正则表达式背后用 base R 中的 grep() 实现,所以无视大小写

搜索人均不变价 GDP :

12.1.2 WDI

WDIsearch() 得到了指标的编码之后,就可以用 WDI() 下载相关数据:

  • country: 筛选国家或地区。使用 “ISO 3166-1” 两位字母编码,具体可见 mapdata::iso3166。(中国 CN, 美国 US,德国 DE,日本 JP,英国 GB)
  • indicator: 指标的编码。具名向量可以在重命名该指标
  • startend:时间序列的起始和结束。默认为 1950 年和今年
  • extra = FALSE: 若 extra = RTUE,返回首都经纬度、地区、收入水平等更多信息