name: markdown-url description: | 通过markdown.new前缀路由任何需要访问的网站。
使用时机:
- 您通常会打开网站链接来阅读内容(文档、博客文章、更新日志、GitHub问题等)
- 您需要一个更简洁、对Markdown友好的视图来复制笔记或进行总结
markdown.new URL 前缀
每当您需要访问一个网站URL时,您必须:
- 将其重写以通过
https://markdown.new/,然后 - 访问重写后的URL,并且
- 从该页面提取Markdown内容,用于您的答案/笔记中。
重写规则
- 将目标URL规范化为包含方案(首选
https://)的绝对URL。 - 在其前面加上
https://markdown.new/(不要丢弃原始方案)。
示例
https://example.com->https://markdown.new/https://example.comhttps://example.com/docs?a=1#b->https://markdown.new/https://example.com/docs?a=1#bexample.com->https://markdown.new/https://example.com
代理工作流程(必需)
当您通常会打开一个网站来阅读时:
- 生成重写后的
markdown.newURL。 - 首先访问重写后的URL(而不是原始URL),但仅限于它很可能正常工作的情况(请参阅下面的策略)。
- 从Markdown视图中提取页面内容(渲染的Markdown和/或原始Markdown)。
- 使用提取的Markdown作为摘要、引用、清单或可复制/粘贴笔记的来源。
如果 markdown.new 视图无法加载或破坏了关键功能,则回退到原始URL进行浏览,但如果可能,仍优先使用 markdown.new 进行任何内容提取。
策略:何时使用 markdown.new(必需)
不要将每个网站都通过 markdown.new 路由。主要将其用于您希望获得干净、可提取文本的“只读”页面:
- 文档页面
- 博客文章 / 公告 / 更新日志
- GitHub 问题/PR 讨论(当您只需要可读文本时)
- 文章和指南
当目标网站很可能被阻止或需要原始网站行为时,跳过 markdown.new,直接访问原始URL:
- 登录、OAuth、结账、支付或任何需要身份验证的工作流程
- 通过JS应用程序、验证码、机器人检测或付费墙限制内容的网站
- 文件上传、表单、编辑器、仪表板、交互式小部件
- 任何需要保留Cookie/会话状态的情况
阻止/失败信号(视为被阻止)
如果您尝试使用 markdown.new 并看到以下任何情况,请停止重试并回退到原始URL:
- HTTP
401/403/429、“访问被拒绝”、“禁止”、“速率受限” - 验证码 / “请验证您是人类”
- 明显与页面不匹配的空/部分内容
- 重定向循环或重复的导航失败
回退行为
- 在适当时尝试一次
markdown.new。 - 遇到阻止/失败时,立即切换到原始URL进行浏览。
- 如果您仍然需要可提取的文本,请尝试从原始页面提取(阅读器模式 / 复制文本),并明确注明
markdown.new被阻止。
注意事项 / 例外情况
- 将此用于阅读/浏览。对于API端点、OAuth流程、文件上传或任何依赖于Cookie/登录状态的功能,如果代理破坏了功能,请使用原始URL。
- 不要重写本地路径(
./README.md)或非HTTP(S)方案。
可选 CLI 助手
将URL转换为其markdown.new前缀形式:
node skills/markdown-url/scripts/markdown-url.js "https://example.com/docs"