Ripgrep快速文本搜索Skill ripgrep

Ripgrep(rg)是一个快速、递归的文本搜索工具,用于在文件中搜索正则表达式模式。它比grep更快,默认尊重.gitignore,适用于代码搜索、文档查找、大型文件搜索等场景。关键词:快速文本搜索、命令行工具、代码搜索、文件搜索、正则表达式、DevOps工具。

DevOps 0 次安装 0 次浏览 更新于 3/9/2026

名称:ripgrep 描述:当需要在文件、代码库、书籍或文档中搜索文本时使用。当通过模式查找文件、搜索过大而无法完全读取的文件、从多个文件中提取特定内容,或者当grep/find太慢时使用。触发词包括“搜索”、“查找出现”、“查找模式”、“在文件中搜索”。

Ripgrep (rg) - 快速文本搜索工具

概述

Ripgrep是一个面向行的搜索工具,递归地在目录中搜索正则表达式模式。它比grep快10-100倍,默认尊重.gitignore。用它替代grep、find或手动读取大型文件。

**核心原则:**当需要在文件中查找文本时,使用ripgrep。不要将整个文件读入上下文,而是搜索它们。

何时使用

使用ripgrep当:

  • 在代码库或目录中搜索文本模式
  • 查找函数、变量或字符串的所有出现
  • 搜索书籍、文档或大型文本文件
  • 文件太大无法完全读入上下文
  • 一次性在许多文件中查找特定内容
  • 查找包含(或不包含)特定模式的文件
  • 提取匹配行进行分析

不使用当:

  • 需要完整文件内容(使用读取工具)
  • 仅通过文件名进行简单通配符模式匹配(使用Glob工具)
  • 需要结构化数据提取(考虑jq、awk)

快速参考

任务 命令
基本搜索 rg "模式" [路径]
大小写不敏感 rg -i "模式"
智能大小写(自动) rg -S "模式"
仅全词 rg -w "词"
固定字符串(无正则表达式) rg -F "字面字符串"
显示上下文行 rg -C 3 "模式"(前后各3行)
显示行号 rg -n "模式"(在tty中默认)
仅文件名 rg -l "模式"
无匹配的文件 rg --files-without-match "模式"
计数匹配 rg -c "模式"
仅匹配部分 rg -o "模式"
反转匹配 rg -v "模式"
多行搜索 `rg -U "模式.*
更多"`

文件过滤

按文件类型

Ripgrep有内置的文件类型定义。使用-t包含,-T排除:

# 仅搜索Python文件
rg -t py "def main"

# 仅搜索JavaScript和TypeScript
rg -t js -t ts "import"

# 排除测试文件
rg -T test "function"

# 列出所有已知类型
rg --type-list

常见类型: py, js, ts, rust, go, java, c, cpp, rb, php, html, css, json, yaml, md, txt, sh

按通配符模式

# 仅.tsx文件
rg -g "*.tsx" "useState"

# 排除node_modules(除了gitignore)
rg -g "!node_modules/**" "模式"

# 仅src目录中的文件
rg -g "src/**" "模式"

# 多个通配符
rg -g "*.js" -g "*.ts" "模式"

# 大小写不敏感通配符
rg --iglob "*.JSON" "模式"

按文件大小

# 跳过大于1MB的文件
rg --max-filesize 1M "模式"

目录控制

# 限制深度
rg --max-depth 2 "模式"

# 搜索隐藏文件(点文件)
rg --hidden "模式"

# 跟随符号链接
rg -L "模式"

# 忽略所有忽略文件(.gitignore等)
rg --no-ignore "模式"

# 渐进式无限制(-u最多可堆叠3次)
rg -u "模式"      # --no-ignore
rg -uu "模式"     # --no-ignore --hidden
rg -uuu "模式"    # --no-ignore --hidden --binary

上下文选项

# 匹配后的行
rg -A 5 "模式"

# 匹配前的行
rg -B 5 "模式"

# 匹配前后的行
rg -C 5 "模式"

# 匹配时打印整个文件(直通模式)
rg --passthru "模式"

输出格式

# 仅匹配的文件名
rg -l "模式"

# 无匹配的文件
rg --files-without-match "模式"

# 每文件匹配计数
rg -c "模式"

# 总匹配计数(非行)
rg --count-matches "模式"

# 仅匹配文本(非整行)
rg -o "模式"

# JSON输出(用于解析)
rg --json "模式"

# Vim兼容输出(文件:行:列:匹配)
rg --vimgrep "模式"

# 带统计信息
rg --stats "模式"

正则表达式模式

Ripgrep默认使用Rust正则表达式语法:

# 交替
rg "foo|bar"

# 字符类
rg "[0-9]+"
rg "[a-zA-Z_][a-zA-Z0-9_]*"

# 词边界
rg "\bword\b"

# 量词
rg "colou?r"           # 0或1
rg "go+gle"            # 1或更多
rg "ha*"               # 0或更多
rg "x{2,4}"            # 2到4次

# 组
rg "(foo|bar)baz"

# 前瞻/后瞻(需要-P用于PCRE2)
rg -P "(?<=prefix)content"
rg -P "content(?=suffix)"

多行匹配

# 启用多行模式
rg -U "start.*
end"

# 点也匹配换行
rg -U --multiline-dotall "start.*end"

# 跨行匹配
rg -U "function\s+\w+\([^)]*\)\s*\{"

替换(仅预览)

Ripgrep可以显示替换效果(不修改文件):

# 简单替换
rg "旧" -r "新"

# 使用捕获组
rg "(\w+)@(\w+)" -r "$2::$1"

# 移除匹配(空替换)
rg "模式" -r ""

搜索特殊文件

压缩文件

# 搜索gzip、bzip2、xz、lz4、lzma、zstd文件
rg -z "模式" file.gz
rg -z "模式" archive.tar.gz

二进制文件

# 包含二进制文件
rg --binary "模式"

# 将二进制作为文本处理(可能产生垃圾)
rg -a "模式"

大型文件

对于太大无法读入上下文的文件:

# 搜索并仅显示匹配行
rg "特定模式" large_file.txt

# 每文件限制前N个匹配
rg -m 10 "模式" huge_file.log

# 显示字节偏移以导航大文件
rg -b "模式" large_file.txt

# 使用head/tail进行分页
rg "模式" large_file.txt | head -100

性能提示

  1. 指定路径 - 当知道子目录时,不要从根目录搜索
  2. 使用文件类型 - -t py-g "*.py" 更快
  3. 使用固定字符串 - 当不需要正则表达式时使用 -F
  4. 限制深度 - 当知道结构时使用 --max-depth
  5. 让gitignore工作 - 除非需要,否则不要使用 --no-ignore
  6. 使用词边界 - -w 是优化的

常见模式

查找函数定义

# Python
rg "def \w+\(" -t py

# JavaScript/TypeScript
rg "(function|const|let|var)\s+\w+\s*=" -t js -t ts
rg "^\s*(async\s+)?function" -t js

# Go
rg "^func\s+\w+" -t go

查找导入/要求

# Python
rg "^(import|from)\s+" -t py

# JavaScript
rg "^(import|require\()" -t js

# Go
rg "^import\s+" -t go

查找TODO/FIXME注释

rg "(TODO|FIXME|HACK|XXX):"

查找错误处理

# Python
rg "except\s+\w+:" -t py

# JavaScript
rg "\.catch\(|catch\s*\(" -t js

查找类定义

# Python
rg "^class\s+\w+" -t py

# JavaScript/TypeScript
rg "^(export\s+)?(default\s+)?class\s+\w+" -t js -t ts

在书籍/文档中搜索

# 查找章节标题
rg "^(Chapter|CHAPTER)\s+\d+" book.txt

# 查找引用的文本
rg '"[^"]{20,}"' document.txt

# 查找包含词的段落
rg -C 2 "关键词" book.txt

与其他工具结合

# 查找文件,然后搜索
rg --files | xargs rg "模式"

# 搜索并按文件计数
rg -c "模式" | sort -t: -k2 -rn

# 搜索并在编辑器中打开
rg -l "模式" | xargs code

# 提取唯一匹配
rg -o "\b[A-Z]{2,}\b" | sort -u

# 从文件搜索多个模式
rg -f patterns.txt

退出代码

代码 含义
0 找到匹配
1 未找到匹配
2 发生错误

脚本有用:

if rg -q "模式" file.txt; then
    echo "找到"
fi

常见错误

错误 修复
模式有特殊字符 使用 -F 用于固定字符串或转义:rg "foo\.bar"
找不到隐藏文件 添加 --hidden-uu
缺少node_modules 添加 --no-ignore(但通常跳过是正确的)
正则表达式太复杂 尝试 -P 用于PCRE2与前瞻/后瞻
输出太长 使用 -m N 限制,或 -l 仅文件名
二进制文件被跳过 添加 --binary-a 用于文本模式
需要看整行 移除 -o(仅匹配)标志

何时更偏好其他工具

任务 更好工具
结构化JSON查询 jq
基于列的文本处理 awk
流编辑/替换 sed(实际修改文件)
仅按名称查找文件 fdfind
简单文件列表 lsglob
需要完整文件内容 读取工具