4.16 处理性能

当你对一个很长的字符串进行大量的正则表达式匹配的时候,你需要考虑性能问题了,这时候该考虑启用合适的选项,一般来讲, PCRE 比默认的正则表达式引擎快,fixed=TRUE 可以继续加快匹配速度,特别是当每个模式只匹配少量次数时。

连接字符串,paste/c/bfile/bracket 函数性能比较 https://wch.github.io/string_builder/index.html

R 内置的默认正则表达式匹配方式是基于 PCRE 的匹配,options 控制 PCRE 默认的三个选项 PCRE_limit_recursion=NAPCRE_study=10PCRE_use_JIT=TRUE,当前系统环境下 PCRE 的支持情况

pcre_config()
##              UTF-8 Unicode properties                JIT              stack 
##               TRUE               TRUE               TRUE              FALSE

查看R环境的 PCRE 配置

sapply(c("PCRE_limit_recursion", "PCRE_study", "PCRE_use_JIT"), getOption)
## PCRE_limit_recursion           PCRE_study         PCRE_use_JIT 
##                   NA                FALSE                 TRUE