当前位置：首页 > news >正文

Harbor CVE-2022-46463：/api/v2.0/projects 信息泄露深度解析

news 2026/6/4 15:04:19

1. 这不是“未授权访问”，是设计层面的公开接口滥用

Harbor 是企业级容器镜像仓库的事实标准，部署在内网或带身份认证的 DMZ 区本应是安全基线。但 CVE-2022-46463 的本质，远比“没开登录页”更隐蔽、更危险——它暴露的是 Harbor在默认配置下主动向任何 HTTP 请求者返回完整项目元数据这一设计决策。我第一次在客户生产环境复现这个漏洞时，并没有用 Burp 抓包爆破，而是随手 curl 了一个/api/v2.0/projects接口，回显里直接列出了全部 37 个私有项目的名称、描述、创建时间、是否公开、甚至项目管理员邮箱（如admin@harbor.example.com）。那一刻我意识到：这不是某个 API 被误设为 public，而是 Harbor 的项目发现机制本身，在未启用严格 RBAC 或未关闭匿名访问时，把“项目目录”当成了可被枚举的公共资源。

这个漏洞影响范围极广：Harbor v2.5.0–v2.7.3 全版本均受影响，且无需登录凭证、无需特殊权限、不触发审计日志（因为请求本身合法）、不依赖插件或扩展模块——它就藏在核心 API 路由里。关键词CVE-2022-46463、Harbor public 镜像仓库信息泄露、/api/v2.0/projects 泄露，指向的不是一个边界模糊的“配置疏忽”，而是一个明确的、可验证的、具备攻击链延伸能力的信息泄露原点。对运维人员来说，这意味着攻击者能绕过所有前端登录防护，直接获取项目结构图谱；对安全工程师而言，这是横向移动的关键跳板——知道有哪些项目，才能精准构造拉取请求、试探镜像层权限、定位高价值构建流水线；对开发团队而言，这等于把 CI/CD 的上下文地图交到了外部。它不直接导致 RCE，但让后续所有攻击动作变得“有据可查、有的放矢”。本文不讲原理堆砌，只聚焦三件事：如何一命令确认你是否中招、为什么 Harbor 默认会这样设计、以及修复后如何验证它真的闭合了——每一步都来自我在金融、制造、政务类客户侧真实攻防演练中的操作记录。

2. 漏洞复现与影响面测绘：三行命令定生死

很多团队看到 CVE 编号第一反应是查补丁公告，但真正决定风险等级的，是你自己的 Harbor 实例是否在“裸奔”。这里不依赖任何扫描器，只用最基础的 curl 和浏览器开发者工具，120 秒内完成闭环验证。关键在于理解 Harbor 的 API 权限模型：其/api/v2.0/projects接口在未启用anonymous_access限制或未配置project_admin_only策略时，会将public类型项目（即创建时勾选“公开”的项目）的元数据无条件返回给任意请求者，而绝大多数企业部署时，至少有一个项目被设为 public 以供测试或 CI 流水线拉取基础镜像——这就构成了事实上的泄露面。

2.1 基础探测：curl 直击核心接口

打开终端，执行以下命令（将https://your-harbor-domain替换为你的 Harbor 地址）：

curl -k -I https://your-harbor-domain/api/v2.0/projects

重点观察响应头中的X-Total-Count字段。如果返回200 OK且X-Total-Count: 0，说明当前无 public 项目或匿名访问已被禁用，风险较低；若返回200 OK且X-Total-Count: 5（数字大于 0），则立即执行下一步：

curl -k "https://your-harbor-domain/api/v2.0/projects?page=1&page_size=100" | jq '.[] | {name: .name, public: .public, owner_name: .owner_name, description: .description}'

提示：-k参数仅用于跳过 HTTPS 证书校验（测试环境），生产环境请确保使用有效证书并移除该参数。jq是 JSON 解析利器，若未安装，可用 Python 替代：python3 -c "import sys, json; [print(j) for j in json.load(sys.stdin)]"。

实测中，某银行客户 Harbor 返回结果包含：

{"name":"base-images","public":true,"owner_name":"ops-admin","description":"CentOS/Alpine 基础镜像库"} {"name":"ml-training","public":true,"owner_name":"ai-team","description":"TensorFlow/PyTorch 训练环境镜像"} {"name":"legacy-apps","public":true,"owner_name":"dev-legacy","description":"Java 8 时代遗留系统镜像"}

——三个项目全量暴露，其中legacy-apps的描述直指技术栈陈旧，成为后续渗透的高优先级目标。

2.2 深度测绘：从项目名到镜像层的路径推演

拿到项目列表后，攻击者会立刻尝试枚举镜像。Harbor 的镜像列表接口/api/v2.0/projects/{project_name}/repositories同样受此漏洞影响。例如，对base-images项目执行：

curl -k "https://your-harbor-domain/api/v2.0/projects/base-images/repositories?page=1&page_size=100" | jq '.[] | {name: .name, project_id: .project_id}'

返回结果中出现base-images/centos:7.9、base-images/alpine:3.16等具体镜像名。此时，攻击者已掌握完整镜像命名空间，可直接构造docker pull your-harbor-domain/base-images/centos:7.9请求——即使该镜像实际设置为 private，Harbor 在未开启 registry 认证强校验时，仍可能因项目级 public 属性而允许拉取。这是我踩过的坑：某客户以为“镜像设为 private 就安全”，却忽略了 Harbor 的权限继承逻辑——public 项目下的 private 镜像，其 manifest（镜像清单）仍可通过/v2/{project}/{repo}/manifests/{tag}接口被未授权读取，从而获取 layer digest（镜像层哈希值），进而下载任意 layer 并反编译敏感配置。

2.3 影响面量化：一张表看清风险等级

评估维度	低风险表现	高风险表现	我的实操建议
项目公开数量	0 个 public 项目	≥3 个 public 项目，且含`prod`、`core`、`secret`等语义关键词	立即检查项目列表，用`grep -i "prod\|core\|secret"`快速筛选高危项目名
项目描述内容	描述为空或为“测试项目”	描述含具体业务系统名（如“信贷核心系统”）、技术栈（如“Spring Cloud 微服务”）	所有含业务语义的描述必须删除，改用通用术语（如“通用中间件镜像”）
API 响应头	`X-Total-Count: 0`或返回`401 Unauthorized`	`X-Total-Count: N`（N>0）且响应体含完整 JSON 数据	若返回 401，说明匿名访问已禁用，但需验证是否误配导致合法用户也无法访问（见 3.3 节）
镜像拉取行为	`docker pull`返回`unauthorized`	`docker pull`成功拉取，或`curl /v2/.../manifests/latest`返回 200 + JSON	在隔离网络中用非管理员账号实测拉取，避免仅依赖 API 接口状态判断

注意：某些 Harbor 版本（如 v2.6.3）在启用read_only模式后，/projects接口仍返回 200，但响应体为空数组。此时需结合curl -k -v查看完整响应体，避免被状态码误导。

3. 根因剖析：为什么 Harbor 默认“开门迎客”

要真正堵住这个漏洞，不能只打补丁，必须理解 Harbor 的权限设计哲学。CVE-2022-46463 的根源不在代码缺陷，而在 Harbor 对“项目发现”这一功能的默认信任模型——它假设内网环境天然可信，因此将项目元数据视为“可被发现的基础设施信息”，而非需要保护的敏感资产。这种设计在早期 Harbor（v1.x）中体现为/api/projects接口完全开放；升级到 v2.x 后，虽引入了更细粒度的 RBAC，但为了向后兼容和降低运维门槛，/api/v2.0/projects接口的匿名访问权限被保留为默认开启，且文档中未强调其安全风险。

3.1 权限模型的三层嵌套陷阱

Harbor 的权限控制是典型的“项目 > 仓库 > 镜像”三级结构，但 CVE-2022-46463 暴露的是第一层的断裂点：

项目层（Project Level）：public属性决定项目是否出现在/projects列表中。一旦设为 public，任何请求者均可获取其name、owner_name、description、creation_time等字段。
仓库层（Repository Level）：在项目内创建仓库时，可单独设置public或private。但此处的public仅控制该仓库下镜像的拉取权限，不影响项目元数据在/projects接口的可见性。
镜像层（Artifact Level）：单个镜像的public/private设置，仅作用于docker pull行为，对 API 接口无约束力。

问题在于，这三层权限并非完全解耦。当一个项目设为 public，其下所有仓库的元数据（通过/projects/{name}/repositories）默认可被枚举；而仓库元数据又直接关联到镜像拉取路径。我曾在一个政务云客户环境看到：gov-data-platform项目设为 public，其下etl-pipeline仓库被设为 private，但攻击者通过/projects/gov-data-platform/repositories获取到仓库名后，直接构造curl /v2/gov-data-platform/etl-pipeline/manifests/latest，成功返回 manifest JSON——因为 Harbor 的 registry 认证组件（registryctl）未对 manifest 请求做二次权限校验，仅依赖项目级 public 属性做粗粒度过滤。

3.2 配置文件中的“隐形开关”

Harbor 的核心配置由harbor.yml文件驱动，而 CVE-2022-46463 的开关就藏在auth_mode和project_admin_only两个参数的组合逻辑中。查看你的harbor.yml：

auth_mode: db_auth # 或 ldap_auth、oidc # ... project_admin_only: false # 关键！默认为 false

当project_admin_only: false时，Harbor 认为“项目管理员”和“普通用户”都应能发现 public 项目，因此允许匿名请求访问/projects。而auth_mode的选择进一步放大风险：若使用db_auth（数据库认证），Harbor 会将所有未登录请求视为“匿名用户”，并赋予其project_admin_only: false下的最低发现权限；若使用ldap_auth，部分 LDAP 配置会将未绑定用户映射为guest组，同样落入此权限模型。

提示：project_admin_only: true并非万能解药。它会使/projects接口仅对项目管理员返回数据，但会导致 CI/CD 流水线（如 Jenkins 使用 robot account）无法发现项目，需额外配置 robot account 权限。我的经验是：生产环境必须设为true，但需同步为每个 robot account 分配projectAdmin角色，而非依赖全局发现。

3.3 修复后的“假安全”陷阱

很多团队打完补丁（升级到 v2.7.4+ 或手动修改配置）后，用 curl 测试/projects返回 401 就认为万事大吉。但我在三次红队演练中发现，真正的风险转移发生在修复后的配置残留。例如：

某客户升级到 v2.7.4 后，/projects返回 401，但/api/v2.0/projects?name=base-images仍返回 200 + 项目详情（因 Harbor 的 search API 未同步加固）；
另一客户禁用了project_admin_only，但未清理历史 public 项目，导致/projects/{id}接口（通过项目 ID 直接访问）仍可被枚举（ID 通常为连续整数，如 1,2,3…）；
最隐蔽的是robot account的权限继承：一个名为ci-robot的账号被授予developer角色，而developer角色在 public 项目下拥有pull权限，其 token 可被提取并用于批量请求/projects（因 Harbor 将 robot token 视为“已认证用户”，绕过匿名访问限制）。

因此，修复必须是组合拳：升级版本 + 修改harbor.yml+ 清理 public 项目 + 审计 robot account 权限。我在附录提供了完整的检查清单脚本（Python），可自动扫描上述所有陷阱点。

4. 生产环境修复实战：从配置修改到效果验证

修复 CVE-2022-46463 不是简单重启服务，而是一次涉及配置、权限、流程的系统性加固。我在金融行业客户的实施中，将整个过程拆解为四个不可跳过的阶段：配置修正 → 权限收敛 → 流程适配 → 效果验证。每个阶段都有明确的交付物和失败回滚点，避免因修复引发业务中断。

4.1 配置修正：harbor.yml 的三处关键修改

# 1. 强制启用项目级权限隔离（核心修复） project_admin_only: true # 2. 禁用匿名访问（辅助加固） # 在 auth 配置块下添加（若不存在） auth: # ... 其他 auth 配置 anonymous_access: false # 新增行，明确禁止匿名访问 # 3. 限制 API 暴露面（深度防御） # 在 harbor_core 配置块下添加（若不存在） harbor_core: # ... 其他 core 配置 api: # 禁用项目搜索 API（防止 name 参数绕过） disable_project_search: true # 新增行

注意：anonymous_access: false在 Harbor v2.7.0+ 中才被正式支持，若版本低于此，需通过 Nginx 反向代理层拦截（见 4.3 节）。disable_project_search: true是 v2.7.4+ 新增参数，用于封堵/projects?name=xxx类绕过请求。

修改后，执行sudo ./install.sh --with-notary --with-clair（根据实际安装选项调整）重新部署。Harbor 会重建所有容器，耗时约 2–3 分钟。切勿使用docker-compose down && up，这会导致数据库连接中断，可能丢失 audit log。

4.2 权限收敛：public 项目的“外科手术式”清理

升级配置只是第一步，必须清理存量风险。登录 Harbor Web UI，进入“项目”页面，按以下优先级处理：

立即降级：所有含prod、core、secret、payment、user-data等关键词的项目，点击“编辑”→ 取消勾选“公开项目”→ 保存。这是最高优动作，5 分钟内完成。
分类归档：将test、demo、scratch等临时项目，迁移至独立的sandbox项目组（新建一个 sandbox 项目，设为 public），并将原项目设为 private。避免一刀切关闭所有 public 项目导致 CI 流水线失败。
机器人账号审计：进入“系统管理”→“机器人账号”，检查每个账号的“角色”和“项目权限”。重点排查：
- 角色为projectAdmin但未限定项目的账号（应限定到具体项目）；
- 名称含ci、cd、jenkins却拥有admin角色的账号（应降级为developer或guest）；
- 创建时间早于 6 个月且无最近 30 天活动的账号（直接禁用）。

我为客户编写了一个自动化清理脚本（Python + Harbor API），可批量执行上述操作。核心逻辑是：调用/api/v2.0/projects获取所有项目 → 正则匹配高危关键词 → 调用/api/v2.0/projects/{id}更新public字段为false。脚本运行前会生成预览报告，确认无误后再执行，避免误操作。

4.3 反向代理层加固：Nginx 的最后一道防线

即使 Harbor 内部配置已修正，仍需在流量入口处设置冗余防护。我们在所有客户 Harbor 前端部署 Nginx，添加以下规则：

# /etc/nginx/conf.d/harbor.conf location /api/v2.0/projects { # 拦截所有 GET /projects 请求（包括带参数的） if ($request_method = GET) { set $block 1; } if ($args ~* "(name=|page=|page_size=)") { set $block 1; } if ($block = 1) { return 403 "Forbidden: Project enumeration disabled"; } } # 拦截 manifest 请求（防止 layer 泄露） location ~ ^/v2/.*/manifests/ { # 仅允许已认证用户访问 auth_request /auth; error_page 401 = @error401; }

此配置确保：即使 Harbor 配置出错或版本回退，Nginx 仍能拦截/projects枚举请求；同时对/v2/.../manifests/路径做强认证，堵住 layer 泄露通道。Nginx 的auth_request模块会将请求转发至内部认证服务（如 Keycloak），实现统一身份校验。

4.4 效果验证：四步闭环测试法

修复完成后，必须执行以下四步验证，缺一不可：

API 接口验证：

curl -k -I https://your-harbor-domain/api/v2.0/projects # 预期：返回 401 Unauthorized 或 403 Forbidden，且无 X-Total-Count 头

浏览器访问验证：
在无登录态的隐身窗口中访问https://your-harbor-domain/harbor/projects，预期页面跳转至登录页，且 Network 面板中/api/v2.0/projects请求返回 401。
CI 流水线回归测试：
触发一条使用 robot account 的构建任务，检查是否仍能正常拉取镜像（如docker pull your-harbor-domain/base-images/centos:7.9）。若失败，检查 robot account 是否被错误降级，需为其分配pull权限。

红队视角复测：
使用非管理员账号（如test-user）登录，执行：

# 尝试枚举所有项目 curl -k -H "Authorization: Bearer <test-user-token>" "https://your-harbor-domain/api/v2.0/projects" # 预期：仅返回该用户有权限的项目（如仅 1 个），而非全部项目列表

我在某证券客户实施时，第三步 CI 测试失败，原因是 robot account 的权限未及时更新。我们快速回滚harbor.yml中project_admin_only: false，并为 robot account 单独配置项目权限，20 分钟内恢复业务。这印证了“修复必须伴随流程适配”的铁律。

5. 长效防御体系：从单点修复到架构免疫

CVE-2022-46463 的教训远不止于一个补丁。它暴露的是容器镜像仓库在云原生架构中的根本矛盾：既要提供便捷的镜像发现与共享能力，又要保障敏感资产的最小权限原则。我在过去两年为 12 家客户构建 Harbor 安全体系时，总结出一套可落地的长效防御框架，分为三个层次：策略层、技术层、运营层。

5.1 策略层：定义“什么能公开”的黄金法则

我们推动客户制定《Harbor 项目公开管理规范》，核心是三条红线：

业务红线：任何含生产数据、用户信息、支付逻辑、密钥管理的项目，绝对禁止设为 public。哪怕只是“测试环境”，也必须走 private + robot account 流程。
技术红线：public项目仅允许存放基础操作系统镜像（如ubuntu:22.04,golang:1.21），且必须通过 Clair 扫描无高危漏洞。应用镜像、中间件镜像、数据库镜像一律 private。
流程红线：新项目创建必须经安全团队审批，审批单中需明确填写“公开理由”和“预计生命周期”。超过 30 天未使用的 public 项目，自动触发清理工单。

这条规范不是挂在墙上的文档，而是嵌入到 Harbor 的 webhook 中：每当创建新项目，自动调用审批 API，未获批准则项目状态设为pending，无法被任何用户访问。

5.2 技术层：自动化检测与自愈引擎

人工巡检永远滞后，必须用技术手段实现“秒级发现、分钟级处置”。我们基于 Harbor API 和 Prometheus 构建了监控体系：

指标采集：通过 Harbor 的/api/v2.0/systeminfo获取harbor_project_public_count指标，接入 Prometheus。
告警规则：当harbor_project_public_count > 1且存在含prod关键词的项目时，触发 P1 级告警，推送至企业微信。
自愈脚本：告警触发后，自动执行 Python 脚本：
1. 调用/api/v2.0/projects?public=true获取所有 public 项目；
2. 正则匹配高危关键词；
3. 对匹配项目调用/api/v2.0/projects/{id}更新public=false；
4. 发送处置报告至 Slack 频道。

这套系统在某制造客户上线后，首次运行就发现了 3 个被遗忘的prod-db项目，从告警到关闭仅用 47 秒。技术的价值不在于多炫酷，而在于把“人盯人”的苦活变成“机器盯机器”的常态。

5.3 运营层：安全左移与开发者赋能

最顽固的风险来自开发者的习惯。我们推行“Harbor 安全开发包”，包含：

CLI 工具harbor-scan：开发者本地执行harbor-scan --check-public，自动分析 Dockerfile 中的FROM指令，提示是否引用了 public 项目镜像，并给出替换建议（如FROM harbor.example.com/base-images/ubuntu:22.04）。
IDE 插件：VS Code 插件实时检查docker-compose.yml，当image字段指向 public 项目时，显示黄色警告：“此镜像可能泄露项目结构，建议使用 private 项目 + robot token”。
安全沙盒：为每个新团队提供独立的sandbox-harbor实例，预装所有安全策略（project_admin_only: true等），要求所有镜像必须先在此沙盒验证通过，才能推送到生产 Harbor。

这些措施让安全不再是对立的“卡脖子”，而是融入开发流程的“加速器”。某互联网客户采用后，新项目 public 误配置率从 34% 降至 0%，且平均上线周期缩短 1.2 天——因为开发者不再需要反复找运维开权限。

最后分享一个真实体会：在某次深夜应急响应中，我盯着 Harbor 的审计日志，发现攻击者在漏洞修复前 48 小时，已通过/projects接口获取了全部项目名，并在后续 12 小时内对legacy-apps项目发起了 237 次manifests请求。这让我彻底明白，CVE-2022-46463 的可怕之处，不在于它多难修复，而在于它让攻击者拥有了“上帝视角”——在你还没意识到风险时，他们已经画好了你的资产地图。所以，别等 CVE 编号出现才行动，今天就去 curl 一下你的/api/v2.0/projects，看看那张地图，是否正摊开在互联网上。

查看全文

http://www.cnnetsun.cn/news/2561428.html