• R学习笔记
  • 欢迎
    • 内容概要
    • 授权说明
    • 运行信息
    • 关于本人
  • 1 数据导入导出
    • 1.1 readxl
      • 1.1.1 安装
      • 1.1.2 用法
      • 1.1.3 批量读取
      • 1.1.4 批量输出
    • 1.2 writexl
      • 1.2.1 用法
    • 1.3 openxlsx
      • 1.3.1 安装
      • 1.3.2 基础功能
      • 1.3.3 定制格式输出
      • 1.3.4 函数参数
      • 1.3.5 总结
    • 1.4 readr
      • 1.4.1 安装
      • 1.4.2 用法
      • 1.4.3 导出功能
      • 1.4.4 总结
    • 1.5 vroom
      • 1.5.1 安装
      • 1.5.2 用法
    • 1.6 Rstudio导入
      • 1.6.1 rstudio 工具栏导入
      • 1.6.2 插件导入
    • 1.7 文件路径
      • 1.7.1 指定路径
      • 1.7.2 默认路径
    • 1.8 拓展
      • 1.8.1 tidyxl
      • 1.8.2 参考资料
  • 2 数据处理之-dplyr
    • 2.1 前言
      • 2.1.1 安装
      • 2.1.2 Excel and Sql 类比
      • 2.1.3 常见问题
    • 2.2 基础用法
      • 2.2.1 filter
      • 2.2.2 select
      • 2.2.3 rename
      • 2.2.4 relocate
      • 2.2.5 mutate
      • 2.2.6 arrange
      • 2.2.7 summarise
      • 2.2.8 group_by
    • 2.3 常用函数
      • 2.3.1 条件判断
      • 2.3.2 case_when
      • 2.3.3 计数函数
      • 2.3.4 排序函数
      • 2.3.5 提取向量
      • 2.3.6 slice 系列
      • 2.3.7 group 系列
      • 2.3.8 其它函数
    • 2.4 表关联
      • 2.4.1 两表关联
      • 2.4.2 多表操作
    • 2.5 分组操作
      • 2.5.1 添加分组
      • 2.5.2 查看分组
      • 2.5.3 更改和添加分组变量
      • 2.5.4 删除分组变量
      • 2.5.5 动词影响
    • 2.6 列操作
      • 2.6.1 基础用法
      • 2.6.2 多种函数功能
      • 2.6.3 当前列
    • 2.7 行操作
      • 2.7.1 比较差异
      • 2.7.2 常用案例
    • 2.8 dplyr编程
      • 2.8.1 案例
    • 2.9 参考资料
  • 3 整洁数据之 tidyr
    • 3.1 tidyr 介绍
      • 3.1.1 安装
      • 3.1.2 主要功能
    • 3.2 长宽转换
      • 3.2.1 宽转长
      • 3.2.2 用法
      • 3.2.3 长转宽
      • 3.2.4 用法
    • 3.3 矩形数据
    • 3.4 嵌套数据
      • 3.4.1 基础
      • 3.4.2 嵌套数据和模型
    • 3.5 字符处理
      • 3.5.1 新列提取
      • 3.5.2 拆分
      • 3.5.3 列拆分行
      • 3.5.4 合并多列
    • 3.6 扩展数据框
    • 3.7 缺失值
      • 3.7.1 replace_na
      • 3.7.2 fill
      • 3.7.3 drop_na
  • 4 字符处理
    • 4.1 base R
      • 4.1.1 单双引号
      • 4.1.2 转义
      • 4.1.3 常用函数
      • 4.1.4 新特性
    • 4.2 stringr
      • 4.2.1 安装
      • 4.2.2 基本使用
      • 4.2.3 常用函数
    • 4.3 综合运用
      • 4.3.1 实现excel函数
      • 4.3.2 使用案例
    • 4.4 base 和 stringr
    • 4.5 参考资料
  • 5 时间处理
    • 5.1 base R
      • 5.1.1 Date
      • 5.1.2 POSIXct
      • 5.1.3 POSIXlt
    • 5.2 lubridate
      • 5.2.1 安装包
      • 5.2.2 当前时间日期
      • 5.2.3 构造日期时间
      • 5.2.4 解析日期时间
      • 5.2.5 提取日期时间成分
      • 5.2.6 处理时区
      • 5.2.7 时间间隔
      • 5.2.8 时间日期计算
    • 5.3 综合运用
      • 5.3.1 日报同环比计算
      • 5.3.2 清洗不同类型日期格式
      • 5.3.3 扫码后中奖时间匹配
    • 5.4 补充资料
      • 5.4.1 Excel and R
      • 5.4.2 参考资料
  • 6 因子介绍
    • 6.1 介绍
      • 6.1.1 安装
    • 6.2 用法
      • 6.2.1 创建因子
      • 6.2.2 修改因子顺序
      • 6.2.3 修改因子级别
  • 7 data.table
    • 7.1 基础介绍
      • 7.1.1 读取数据
      • 7.1.2 基本格式
      • 7.1.3 i j by 使用
      • 7.1.4 行列筛选总结
    • 7.2 常规操作
      • 7.2.1 行筛选
      • 7.2.2 新增更新列
      • 7.2.3 排序
    • 7.3 常用函数
      • 7.3.1 特殊符号
      • 7.3.2 排序函数
      • 7.3.3 非重复计数
      • 7.3.4 判断函数
      • 7.3.5 交集 差集 合并
      • 7.3.6 长宽转换
      • 7.3.7 表连接
    • 7.4 高级函数
      • 7.4.1 groupingsets
      • 7.4.2 rleid
      • 7.4.3 shift
      • 7.4.4 J
    • 7.5 小技巧
      • 7.5.1 用{}抑制中间过程输出
      • 7.5.2 使用[]打印data.table
    • 7.6 运用
      • 7.6.1 自定义函数计算
      • 7.6.2 带汇总的聚合运算
      • 7.6.3 行列转变
  • 8 database
    • 8.1 安装数据库
    • 8.2 odbc包
      • 8.2.1 安装包
      • 8.2.2 驱动安装
      • 8.2.3 连接数据库
      • 8.2.4 读写数据库
    • 8.3 DBI包
      • 8.3.1 安装
      • 8.3.2 连接数据库
      • 8.3.3 读写数据库
      • 8.3.4 其它函数介绍
    • 8.4 其他R包
      • 8.4.1 RODBC包
      • 8.4.2 ROracle包
      • 8.4.3 RMySQL包
      • 8.4.4 RSQLite
    • 8.5 大数据相关R包
      • 8.5.1 sparklyr
      • 8.5.2 RClickhouse
    • 8.6 常见问题
      • 8.6.1 乱码问题
      • 8.6.2 无法连接问题
      • 8.6.3 远程连接
      • 8.6.4 跳板机连接
    • 8.7 dbplyr
      • 8.7.1 安装
      • 8.7.2 基础用法
      • 8.7.3 无法正确转化
    • 8.8 参考资料
  • 9 循环结构
    • 9.1 R循环介绍
      • 9.1.1 简单示例
      • 9.1.2 循环结构
      • 9.1.3 循环控制
      • 9.1.4 嵌套循环
    • 9.2 循环变化
      • 9.2.1 修改已有对象
      • 9.2.2 循环模式
      • 9.2.3 未知长度输出
    • 9.3 apply系列函数
      • 9.3.1 lapply 循环迭代
      • 9.3.2 sapply
      • 9.3.3 vapply 迭代安全函数
      • 9.3.4 apply 多维数据
  • 10 循环迭代purrr介绍
    • 10.1 安装
    • 10.2 常规用法
      • 10.2.1 map 系列
      • 10.2.2 pmap 系列
    • 10.3 map系列函数
      • 10.3.1 用法
      • 10.3.2 案例
    • 10.4 map2 系列函数
    • 10.5 pmap系列函数
    • 10.6 归约累计函数
      • 10.6.1 reduce 函数
      • 10.6.2 accumulate 函数
    • 10.7 安全函数
    • 10.8 其他函数介绍
      • 10.8.1 flatten 系列
      • 10.8.2 imap 函数
      • 10.8.3 walk 系列
      • 10.8.4 逻辑判断函数
      • 10.8.5 提取函数
      • 10.8.6 筛选函数
  • 11 自定义函数
    • 11.1 简单示例
    • 11.2 条件执行
      • 11.2.1 多条件执行
    • 11.3 函数参数
      • 11.3.1 参数名称
      • 11.3.2 检查参数值
      • 11.3.3 …参数
    • 11.4 返回值
      • 11.4.1 显式返回
      • 11.4.2 编写管道函数
    • 11.5 环境
    • 11.6 拓展部分
  • 12 R语言文件系统操作
    • 12.1 base R
      • 12.1.1 用法
    • 12.2 fs package
      • 12.2.1 安装
      • 12.2.2 优势
      • 12.2.3 基础用法
    • 12.3 fs函数介绍
      • 12.3.1 文件操作
      • 12.3.2 目录操作
      • 12.3.3 链接操作
      • 12.3.4 路径操作
      • 12.3.5 辅助函数
    • 12.4 base-fs-shell比较
    • 12.5 参考资料
  • gitee地址

商业数据分析师-R 语言数据处理

8.8 参考资料

1.DBI包资料 https://dbi.r-dbi.org/reference/

2.dbplyr包资料 https://dbplyr.tidyverse.org/

3.rstudio关于数据库介绍 https://db.rstudio.com/databases

4.数据库连接字符串介绍 https://www.connectionstrings.com/

5.驱动安装 https://github.com/r-dbi/odbc#installation

6.关于Roracle的安装介绍 https://mp.weixin.qq.com/s/QLwedZ5mTybqSXdHMTGRIw

7.DBI消息 https://www.r-consortium.org/blog/2017/05/15/improving-dbi-a-retrospect