搜索集群 search-cluster

搜索集群是一个用于多源信息收集的Python工具,支持并行查询Google、维基百科、Reddit、NewsAPI和RSS订阅源,并提供结构化JSON输出。具备Redis缓存功能,提升查询效率。适用于数据聚合、信息监控、市场研究、新闻追踪和舆情分析等场景。

后端开发 0 次安装 0 次浏览 更新于 2/24/2026

name: search-cluster description: 统一搜索聚合器,支持Google、Wikipedia、Reddit、NewsAPI和RSS订阅源,可选Redis缓存。支持并行查询和结构化JSON输出。 metadata: {“openclaw”:{“requires”:{“bins”:[“python3”],“env”:[“GOOGLE_CSE_KEY”,“GOOGLE_CSE_ID”,“NEWSAPI_KEY”]},“install”:[{“id”:“pip-deps”,“kind”:“exec”,“command”:“pip install redis”}]}}

搜索集群

统一的多源信息收集搜索系统。

前提条件

  • 二进制文件:必须安装python3
  • Google搜索:需要GOOGLE_CSE_KEYGOOGLE_CSE_ID
  • NewsAPI:需要NEWSAPI_KEY
  • 缓存(可选):活动的Redis实例(默认为localhost:6379)。

设置

  1. 在环境变量或本地.env文件中定义API密钥。
  2. 安装可选的Redis客户端:pip install redis

核心工作流

1. 单源搜索

查询特定搜索引擎以获取目标结果。

  • 用法python3 $WORKSPACE/skills/search-cluster/scripts/search-cluster.py <source> "<query>"
  • 来源googlewikiredditnewsapi

2. 聚合搜索

并行查询所有支持的引擎并聚合结果。

  • 用法python3 $WORKSPACE/skills/search-cluster/scripts/search-cluster.py all "<query>"

3. RSS/订阅源获取

检索并解析标准的RSS或Atom订阅源。

  • 用法python3 $WORKSPACE/skills/search-cluster/scripts/search-cluster.py rss "<url>"

可靠性与安全性

  • 安全网络:对所有API和订阅源请求强制执行严格的SSL/TLS验证。不允许未经验证的回退。
  • 命名空间隔离:缓存键以search:为前缀以避免冲突。
  • 本地偏好:Redis连接默认使用localhost。用户必须为远程实例显式设置REDIS_HOST
  • 用户代理:使用标准化的SearchClusterBot代理以遵守网站政策。

参考