MarkdownURL代理 markdown-url

Markdown URL 代理技能是一个自动化工具,用于将网页URL重写为通过markdown.new服务访问,从而获取页面的Markdown格式内容。该技能主要用于网页内容提取、文档阅读、笔记整理和文本摘要,适用于技术文档、博客文章、GitHub讨论等只读场景。它能提供更干净、可复制的文本视图,提升信息处理效率。关键词:Markdown转换,URL重写,内容提取,网页转Markdown,文档整理,自动化工具。

前端开发 0 次安装 0 次浏览 更新于 3/5/2026

name: markdown-url description: | 通过markdown.new前缀路由任何需要访问的网站。

使用时机:

  • 您通常会打开网站链接来阅读内容(文档、博客文章、更新日志、GitHub问题等)
  • 您需要一个更简洁、对Markdown友好的视图来复制笔记或进行总结

markdown.new URL 前缀

每当您需要访问一个网站URL时,您必须:

  1. 将其重写以通过 https://markdown.new/,然后
  2. 访问重写后的URL,并且
  3. 从该页面提取Markdown内容,用于您的答案/笔记中。

重写规则

  1. 将目标URL规范化为包含方案(首选 https://)的绝对URL。
  2. 在其前面加上 https://markdown.new/(不要丢弃原始方案)。

示例

  • https://example.com -> https://markdown.new/https://example.com
  • https://example.com/docs?a=1#b -> https://markdown.new/https://example.com/docs?a=1#b
  • example.com -> https://markdown.new/https://example.com

代理工作流程(必需)

当您通常会打开一个网站来阅读时:

  1. 生成重写后的 markdown.new URL。
  2. 首先访问重写后的URL(而不是原始URL),但仅限于它很可能正常工作的情况(请参阅下面的策略)。
  3. 从Markdown视图中提取页面内容(渲染的Markdown和/或原始Markdown)。
  4. 使用提取的Markdown作为摘要、引用、清单或可复制/粘贴笔记的来源。

如果 markdown.new 视图无法加载或破坏了关键功能,则回退到原始URL进行浏览,但如果可能,仍优先使用 markdown.new 进行任何内容提取。

策略:何时使用 markdown.new(必需)

不要将每个网站都通过 markdown.new 路由。主要将其用于您希望获得干净、可提取文本的“只读”页面:

  • 文档页面
  • 博客文章 / 公告 / 更新日志
  • GitHub 问题/PR 讨论(当您只需要可读文本时)
  • 文章和指南

当目标网站很可能被阻止或需要原始网站行为时,跳过 markdown.new,直接访问原始URL:

  • 登录、OAuth、结账、支付或任何需要身份验证的工作流程
  • 通过JS应用程序、验证码、机器人检测或付费墙限制内容的网站
  • 文件上传、表单、编辑器、仪表板、交互式小部件
  • 任何需要保留Cookie/会话状态的情况

阻止/失败信号(视为被阻止)

如果您尝试使用 markdown.new 并看到以下任何情况,请停止重试并回退到原始URL:

  • HTTP 401/403/429、“访问被拒绝”、“禁止”、“速率受限”
  • 验证码 / “请验证您是人类”
  • 明显与页面不匹配的空/部分内容
  • 重定向循环或重复的导航失败

回退行为

  1. 在适当时尝试一次 markdown.new
  2. 遇到阻止/失败时,立即切换到原始URL进行浏览。
  3. 如果您仍然需要可提取的文本,请尝试从原始页面提取(阅读器模式 / 复制文本),并明确注明 markdown.new 被阻止。

注意事项 / 例外情况

  • 将此用于阅读/浏览。对于API端点、OAuth流程、文件上传或任何依赖于Cookie/登录状态的功能,如果代理破坏了功能,请使用原始URL。
  • 不要重写本地路径(./README.md)或非HTTP(S)方案。

可选 CLI 助手

将URL转换为其markdown.new前缀形式:

node skills/markdown-url/scripts/markdown-url.js "https://example.com/docs"