Chapter 1 简介及相关概念

ECharts是一个基于JavaScript的开源可视化图表库,由于其交互性强、使用简单、界面美观、自定义程度强等特点被广泛应用,国内互联网公司内部多使用此开源库制作内部的数据中台或业务看板。ECharts最初由百度团队开源,并于2018年初捐赠给Apache基金会,成为ASF孵化级项目。John Coene将基于javascript的echarts库成功与R语言结合,构建成echarts4r包,使得R的使用者无需精通javascript语言,就可以在R中轻松调用ECharts进行数据可视化。类似的还有使用python语言封装的pyecharts。相比ggplot2,echarts4r上手更快、更易被初学者理解,并且不需要复杂配置就可以做出美观的可视化结果。

1.1 数据集

在使用echarts可视化之前,先确保你已经了解了数据分析中常见概念和规范

1.1.1 维度和指标

理解指标和维度的含义和区别: 指标是基于原始数据一个或多个维度的统计结果 链接

1.1.2 格式规范

使用推荐的数据集进行数据分析:数据集里的每个字段(列)都是维度或指标的名称,而不能是维度或指标的值。
换句话说数据中的每一列都应该是如“日期”、“城市”、“性别”的维度或是“身高”、“体重”、“分数”、“留存率”的指标。不应该有以“男”、“女”命名的列或者“安徽”、“北京”、“上海”命名的列。如果不幸你的数据偏偏是这样不规范的,可以通过「宽转长」(pivot_longer()),把它转换成推荐的长数据的形式。

下面的数据是一个不推荐格式:

data_bad = data.frame(
  dt = seq.Date(from = as.Date("2022-07-01"), length.out = 3, by = "1 day"),
  `` = c(18, 19, 29),
  `` = c(32, 21, 28)
)

datatable(data_bad)

我们使用pivot_longer()把它从一个较宽的数据转换成符合标准的长数据。关于长宽转换方法可参考链接

data_good = data_bad |> 
  pivot_longer(
    -c(dt),
    names_to = "性别",
    values_to = "年龄"
  )

datatable(data_good)

1.2 坐标轴