布莱恩喵
折腾笔记已复盘

AI 工具敏感信息检查:公开内容前我会先删什么

AI 工具笔记里最容易混入访问凭证、真实路径、备份关键材料和网络配置。公开之前,必须先把风险点显性化。

AI 工具内容安全Obsidian发布流程

我现在整理网站文章时,有一个越来越明确的动作:先做敏感信息检查,再谈润色。

这不是因为我想把流程弄复杂,而是因为 AI 工具笔记太容易混入危险细节。安装时的一条命令、调试时的一段返回、备份时的一行配置,放在私人 Obsidian 里可能只是备忘,放到公开网站上就可能变成风险。

所以公开内容前,我不会先问“这篇能不能写得更漂亮”,而是先问“这里有没有不该公开的东西”。

为什么折腾

AI 工具折腾最常见的记录方式,是边装边记。

今天装一个 MCP 工具,明天配置一个 agent,后天调一个自托管服务。过程中会出现很多临时命令、路径、凭证名称、服务地址、备份步骤和错误日志。

这些东西有些只是示例,有些可能接近真实配置。时间久了,自己也未必一眼分得清。

如果把它们直接改写成网站文章,很容易把私人工作环境暴露出去。

我的公开版检查范围

我目前重点检查几类内容:

  • 访问凭证、令牌、授权头和接口密钥线索。
  • SSH、数据库、备份恢复相关关键材料。
  • 本机用户名、真实目录、NAS 挂载位置和项目路径。
  • 内网地址、设备标识、端口暴露方式和远程访问细节。
  • 账号、财务、家庭、身份相关内容。

这些内容不是不能记录,而是不应该出现在公开版里。

实际怎么做

第一步是把风险显性化。

我不会一上来删除原笔记。原笔记是私人资料,也可能是以后排错的证据。更稳妥的方式是先标出哪些笔记可能有风险,再决定怎么处理。

第二步是区分示例和真实信息。

有些内容看起来像密钥,其实只是文档里的占位示例。有些内容看起来像说明,实际可能包含真实配置。这个判断不能完全交给自动化,至少要人工确认一次。

第三步是公开文章只保留原则和过程。

比如 Coolify 备份恢复可以讲“关键凭证要单独保存”“恢复要做演练”“权限和数据都要验证”,但不需要把真实恢复细节贴出来。

第四步是把网站内容和私人库隔离。

网站文章、分发包、发布队列都放在项目目录。Obsidian 只作为来源素材,不保存公开内容的运营全文。

哪里卡住

第一个坑是教程写法会诱导你贴细节。

很多技术文章为了显得完整,会把命令、路径、配置一股脑贴出来。但个人网站不需要这样。我的站更像折腾复盘,不是给陌生人复制粘贴执行的运维手册。

第二个坑是 AI 会保留太多上下文。

如果让 AI 直接从原始笔记改写,它可能觉得某些路径和参数“很有用”,于是保留下来。现在我更倾向于先让它按风险类型扫描,再进入写作。

第三个坑是删太狠也会丢掉真实感。

脱敏不是把文章洗成空话。真正好的公开版,是保留真实需求、真实踩坑和取舍,只删掉会定位到个人环境的细节。

值不值得

非常值得。

个人网站越写越多以后,最大的风险不是某一篇写得不好,而是某个细节不该公开却被长期挂在线上。

敏感信息检查不是拖慢内容生产,而是让内容生产可持续。否则写得越多,心里越不踏实。

下一步

以后网站内容流程里,我会把敏感信息检查放在固定位置:

  • 先读素材。
  • 再做风险扫描。
  • 然后公开重写。
  • 最后生成分发包。

这一步看起来不浪漫,但它决定了网站能不能长期放心更新。