当前位置：首页 > news >正文

浏览器端敏感信息检测实践：Hx0 数据卫士（Hx0 DataGuard）功能梳理与使用体会

news 2026/6/3 3:54:58

前言

这两年有两个变化，做安全或开发的同学应该都有体感：

AI 办公普及：日志、配置、客户资料被直接粘贴进 ChatGPT、文心一言、豆包等对话框的情况越来越多，误发 API Key、数据库连接串的风险明显上升。
前端暴露面排查仍较分散：硬编码密钥、调试接口、不该出现在浏览器侧的 API 路径，往往要借助多个工具才能发现。

企业级 DLP 部署重、成本高；纯手工 grep 又跟不上日常节奏。最近注意到 GitHub 上有一个叫 Hx0 DataGuard（Hx0 数据卫士）的浏览器扩展，把「页面暴露面扫描」和「输入防泄漏」放在浏览器里本地运行。

项目地址：https://github.com/asaotomo/Hx0-DataGuard

本文基于其公开 README 与 v1.0.3 更新说明，做一次功能梳理和使用场景分析，供同行参考。

工具定位

Hx0 数据卫士（Hx0 DataGuard ）是一款 Chrome / Firefox 浏览器扩展，核心思路可以概括为两条线：

方向	能力	典型对象
往外看	页面敏感信息检测、API 路径发现	DOM、内联脚本、外链 JS、HTML 注释
往里守	输入防泄漏	AI 对话框、表单、聊天输入框

官方强调本地计算为主：扫描结果默认保存在本机，不上传页面正文，无需注册账号即可使用基础流程。这一点对在意数据外泄的测试/办公场景比较重要，但具体隐私策略仍以扩展内《用户协议与隐私政策》为准。

官方说明：工具输出仅供辅助研判与安全自检，不能替代正式渗透测试、代码审计或合规结论。

核心模块拆解

1. 页面敏感信息检测

对当前页面的 DOM、脚本、注释做规则匹配，找出疑似明文暴露的敏感数据，例如：

手机号、身份证号
API Key、Token
其他可自定义规则

v1.0.3 的一个实用改进是：命中结果会标注具体来源——主文档、内联脚本、外链 JS、HTML 注释等分开显示；长文件名可悬停查看完整路径；复制按钮复制的是原始命中值，便于二次验证。

规则中心新增了「页面注释」分类（默认开启），专门扫描 HTML 注释里的凭据、环境变量、TODO/FIXME 等线索。这类信息在真实项目里并不少见，开发阶段注释里留连接串、测试账号的情况时有发生。

2. API 检测与探测

从页面及外链 JavaScript 中提取 API 路径、Webhook、内网地址等接口线索，例如/api/admin/、/internal/debug这类不应轻易暴露在前端的路径。

v1.0.3 在探测侧增加了更细的控制项：

批量 HTTP 探测可配置间隔、并发数、单条超时
支持勾选「携带 Cookie」，并可预览请求包中的 Cookie 头
结果可导出 JSON / Markdown / CSV

对授权范围内的安全测试来说，这相当于在浏览器里做一轮轻量级的前端资产梳理，不必每次都搭完整工具链。但需要注意：命中不等于漏洞，注释诱饵、测试样例、Webpack 打包后的混淆字符串都可能产生误报，必须人工复核。

3. 输入防泄漏

在用户输入或粘贴内容、点击发送之前，对文本做敏感信息识别，支持：

轻提醒 / 标准 / 强拦截三档力度
对常用 AI 站点做了适配优化
剪切板粘贴监测（粘贴前确认）
白名单与 24 小时免打扰

v1.0.3 改进了复杂 AI 站点与自定义输入框的覆盖；输入停顿时右上角展示全部命中；对勾选「是否拦截」的规则，发送时会居中弹窗拦截。

从机制上看，这更接近客户端 DLP 的轻量实现，适合个人办公防护，而不是替代企业级通道管控。

4. 规则中心

内置常见敏感信息规则，支持：

按分类开关
自定义规则
规则导入 / 导出

团队若有统一的敏感数据识别规范，可以把规则导出共享，减少各自为政。

5. 报告导出

扫描完成后可导出 HTML、Markdown、JSON 格式报告，便于留存、汇报或交给开发跟进修复。对做等保、数据安全自查、甲方交付材料的场景，报告导出比截图更规范。

典型使用场景（个人理解）

场景 A：与 AI 对话时的误发防护

实际工作中，把报错日志贴进 AI 问问题太常见了。日志里混进 Key、内网 IP、用户手机号的情况，人工逐行脱敏既慢又容易漏。

开启「输入与发送监测」后，扩展会在发送前扫描内容。若只是提醒模式，用户仍可自行判断；若开启强拦截，则直接阻止发送。登录页输入框默认排除，避免干扰正常认证流程。

场景 B：授权范围内的前端暴露面排查

安全测试人员在已获得书面授权的目标上，可以：

打开目标页面
执行「扫描当前页面敏感信息和 API」
在侧栏分别查看「页面敏感信息」和「API 检测」结果
复核后导出报告

相比单独用 Burp + 手工搜 JS + 正则 grep，浏览器内一键扫描的学习成本更低，适合快速过一遍页面。深度测试仍需要专业工具配合。

场景 C：上线前的开发自检

联调或上线前，开发/测试同学可以快速扫一眼：当前页面及引用脚本里是否残留测试 Key、内网地址、真实用户数据。早发现比上线后被扫到再救火成本低得多。

安装方式

项目提供两种安装路径（信息来自 GitHub README）：

方式一：Chrome 应用商店（当前版本 1.0.3，支持 Edge、Brave 等 Chromium 内核浏览器）

方式二：离线安装包离线安装包（国内）

GitHub Releases 页面提供：

Chrome 系：Hx0-DataGuard-chrome-*.crx
Firefox：Hx0-DataGuard-firefox-*.xpi（AMO 商店审核中，目前以离线包为主）

内网或无法访问应用商店的环境，可以用离线包装。离线版不会自动更新，需关注 Releases 手动升级。

使用流程简述

安装后点击扩展图标，阅读并同意用户协议
若界面显示用户 ID，建议立即备份（无注册模式下用于会员权益找回）
打开目标页面 → 点击「扫描当前页面敏感信息和 API」→ 侧栏查看结果
需要输入防护时，在弹窗开启「输入与发送监测」/「剪切板粘贴监测」
扫描完成后到侧栏「报告」页导出

v1.0.3 更新要点（相对 1.0.2）

模块	变化
页面/JS 扫描	命中来源细分、原始值复制
规则中心	新增「页面注释」分类
API 探测	可配置间隔/并发/超时，Cookie 预览，多格式导出
输入防泄漏	AI 站点适配、全量命中展示、拦截弹窗
体验	Firefox 侧栏报告导出修复、多语言 Toast、Chrome 下载权限优化