Markdown 格式化
Markdown 格式化
适用范围
在以下情况使用此页面:
- 您正在更改出站通道的 Markdown 格式化或分块
- 您正在添加新的通道格式化程序或样式映射
- 您正在调试跨通道的格式化回归
Moltbot 通过将 Markdown 转换为共享的中间表示(IR)然后再呈现通道特定的输出来格式化出站 Markdown。IR 保持源文本完整,同时携带样式/链接范围,以便分块和呈现可以在通道之间保持一致。
目标
- 一致性: 一个解析步骤,多个呈现器。
- 安全分块: 在呈现之前拆分文本,以便内联格式永远不会跨块中断。
- 通道适配: 将相同的 IR 映射到 Slack mrkdwn、Telegram HTML 和 Signal 样式范围,而无需重新解析 Markdown。
管道
- 解析 Markdown -> IR
- IR 是纯文本加上样式范围(粗体/斜体/删除线/代码/剧透)和链接范围。
- 偏移量是 UTF-16 代码单元,因此 Signal 样式范围与其 API 对齐。
- 仅当通道选择加入表转换时才解析表。
- 分块 IR(格式优先)
- 分块在呈现之前发生在 IR 文本上。
- 内联格式不会跨块拆分;范围按块切片。
- 按通道呈现
- Slack: mrkdwn 令牌(粗体/斜体/删除线/代码),链接为
<url|label>。 - Telegram: HTML 标签(
<b>、<i>、<s>、<code>、<pre><code>、<a href>)。 - Signal: 纯文本 +
text-style范围;链接在标签不同时变为label (url)。
- Slack: mrkdwn 令牌(粗体/斜体/删除线/代码),链接为
IR 示例
输入 Markdown:
Hello **world** — see [docs](https://docs.clawd.bot).IR(示意图):
{
"text": "Hello world — see docs.",
"styles": [
{ "start": 6, "end": 11, "style": "bold" }
],
"links": [
{ "start": 19, "end": 23, "href": "https://docs.clawd.bot" }
]
}在哪里使用
- Slack、Telegram 和 Signal 出站适配器从 IR 呈现。
- 其他通道(WhatsApp、iMessage、MS Teams、Discord)仍然使用纯文本或自己的格式规则,在分块之前应用 Markdown 表转换(如果启用)。
表处理
Markdown 表在聊天客户端中不受一致支持。使用 markdown.tables 控制每个通道(和每个帐户)的转换。
code:将表呈现为代码块(大多数通道的默认值)。bullets:将每一行转换为项目符号点(Signal + WhatsApp 的默认值)。off:禁用表解析和转换;原始表文本通过。
配置键:
channels:
discord:
markdown:
tables: code
accounts:
work:
markdown:
tables: off分块规则
- 分块限制来自通道适配器/配置,并应用于 IR 文本。
- 代码围栏被保留为单个块,带有尾随换行符,以便通道正确呈现它们。
- 列表前缀和块引用前缀是 IR 文本的一部分,因此分块不会在前缀中间拆分。
- 内联样式(粗体/斜体/删除线/内联代码/剧透)永远不会跨块拆分;呈现器在每个块内重新打开样式。
如果您需要有关跨通道分块行为的更多信息,请参阅流式传输 + 分块。
链接策略
- Slack:
[label](url)-><url|label>;裸 URL 保持裸露。在解析期间禁用自动链接以避免双重链接。 - Telegram:
[label](url)-><a href="url">label</a>(HTML 解析模式)。 - Signal:
[label](url)->label (url),除非标签与 URL 匹配。
剧透
剧透标记(||spoiler||)仅为 Signal 解析,其中它们映射到 SPOILER 样式范围。其他通道将它们视为纯文本。
如何添加或更新通道格式化程序
- 解析一次: 使用共享的
markdownToIR(...)辅助函数和适当的通道选项(自动链接、标题样式、块引用前缀)。 - 呈现: 实现带有
renderMarkdownWithMarkers(...)的呈现器和样式标记映射(或 Signal 样式范围)。 - 分块: 在呈现之前调用
chunkMarkdownIR(...);呈现每个块。 - 连接适配器: 更新通道出站适配器以使用新的分块器和呈现器。
- 测试: 添加或更新格式测试以及出站传递测试(如果通道使用分块)。
常见陷阱
- Slack 尖括号令牌(
<@U123>、<#C123>、<https://...>)必须保留;安全地转义原始 HTML。 - Telegram HTML 需要转义标签外的文本以避免破坏标记。
- Signal 样式范围取决于 UTF-16 偏移量;不要使用代码点偏移量。
- 保留代码围栏的尾随换行符,以便结束标记落在自己的行上。