当前位置：首页 > news >正文

Steam协议逆向实战：NetHook2与SteamKit2协同分析

news 2026/5/31 15:21:25

1. 这不是“抓包”，而是逆向理解Steam通信协议的起点

很多人第一次听说“NetHook2 + SteamKit2”组合时，下意识会把它等同于Wireshark抓HTTP流量——点开Steam客户端，随便点个好友头像，抓一堆TCP包，然后对着十六进制窗口发呆。我试过三次，每次都在0x3A7F后面卡住，最后关掉Wireshark，默默删掉那堆看不懂的pcap文件。直到某天在Steam社区一个被折叠了27次的评论里看到一句话：“Steam不是HTTP，是Protobuf over TLS over custom framing，你抓到的不是‘请求’，是加密信封里的信封。”这句话让我停下了所有“暴力抓包”的尝试，转而真正去读Steam的协议文档、翻SteamKit2的源码、调试NetHook2的注入逻辑。这才明白：NetHook2不是万能钩子，它只负责在Steam Client进程内存中精准截获序列化前的原始消息体；而SteamKit2也不是SDK，它是一套经过十年社区验证的、对Steam底层协议（尤其是GC、CM、UserLogon等核心服务）的反向工程实现。二者结合的本质，是把“运行时内存中的协议数据”与“离线可解析的协议定义”打通——前者给你原始字节，后者告诉你这串字节到底代表“好友上线”还是“库存刷新失败”。这个组合不解决“能不能抓”，而解决“抓到了怎么读懂”。适合两类人：一是想做Steam辅助工具（如自动库存同步、离线交易监控）的开发者，二是研究游戏平台通信安全机制的安全研究员。如果你只是想看看自己买了什么游戏，那用Steam官方API就够了；但如果你想搞清楚“为什么Steam家庭共享在断网后仍能显示好友在线状态”，那这篇就是你绕不开的第一课。

2. NetHook2：不是注入，是“协议级内存缝合”

2.1 为什么不用EasyHook或Microsoft Detours？

刚接触NetHook2时，我第一反应是：“这不就是个DLL注入器吗？换用Detours不更稳？”结果在Steam Client v1.0.0.72（2023年10月版本）上，Detours直接触发Steam的反调试保护，进程秒退；EasyHook则在CMsgClientLogOnResponse回调里丢失了eresult字段的解密上下文，导致所有登录响应都显示为EResult.Invalid。NetHook2之所以能跑通，关键在于它根本没走传统API Hook路线。它的核心不是hooksend()或recv()，而是定位Steam Client进程中的两个关键内存地址：一个是CProtoBufMsg<CAchievementList>类的虚函数表指针，另一个是CMsgClientLogOn序列化前的临时缓冲区分配点。前者让它能监听任意Protobuf消息的序列化入口，后者让它能拿到未加密、未打包的原始二进制流。你可以把它理解成在Steam自己的序列化引擎内部“插了一根探针”，而不是在socket层“贴了一张胶布”。这种设计规避了TLS加密层的干扰——因为数据在进入SSL_write之前就被截获了。实测下来，在Steam Client更新到v1.0.0.85后，Detours方案需要重写全部6个Hook点，而NetHook2只需微调2行偏移量（offset_to_vtable和offset_to_buffer_alloc），这就是“协议级缝合”带来的稳定性红利。

2.2 注入时机与进程兼容性陷阱

NetHook2的注入不是“启动Steam就注入”，而是必须等待Steam Client完成初始化并加载steamclient.dll之后才能生效。我踩过最深的坑是：用CreateRemoteThread在Steam进程创建后立刻注入，结果NetHook2的DLL被加载到错误的内存段，GetModuleHandleA("steamclient.dll")返回NULL。正确做法是监听NtCreateUserProcess系统调用，当发现新进程命令行含steam.exe且参数带-no-browser（Steam无界面模式常用）时，暂停该进程，再用WriteProcessMemory将NetHook2的shellcode写入steamclient.dll的.data节末尾空隙，最后恢复线程。这个过程听起来复杂，但NetHook2自带的Injector.exe已封装好——问题出在它默认的超时时间（3000ms）太短。在机械硬盘+Win10旧版系统上，Steam Client从启动到steamclient.dll完全映射平均耗时3820ms。我把Injector.ini里的TimeoutMs=5000后，注入成功率从62%升至99.3%。另外，Steam的沙箱机制会让某些模块（如cef_subprocess.exe）拒绝远程线程，所以NetHook2的注入目标必须严格限定为steam.exe主进程，不能选错PID。我写了个小脚本自动过滤：

Get-Process | Where-Object {$_.ProcessName -eq "steam" -and $_.MainWindowTitle -ne ""} | Select-Object Id, ProcessName, MainWindowTitle

只取MainWindowTitle非空的进程，确保是用户可见的主客户端，而非后台更新进程。

2.3 消息过滤与性能损耗实测

NetHook2默认会捕获所有Protobuf消息，包括每秒数十次的CMsgClientPing心跳包。如果全量转发给分析端，你的日志文件1分钟就能到200MB。必须在NetHook2的MessageFilter.cpp里加白名单。我最终保留的只有5类：

CMsgClientLogOnResponse（登录结果，含账号ID、令牌有效期）
CMsgClientFriendMsgIncoming（好友消息，含senderID、messageBody）
CMsgClientInventoryUpdate（库存变更，含appID、itemID、quantity）
CMsgClientGameServerDeny（联机拒绝，含serverIP、reasonCode）
CMsgClientVACStatusResponse（VAC状态，含bBanned、unVacBanTime）

其他消息全部return false跳过。这样CPU占用率从12%降到1.3%，内存增长控制在8MB以内。> 提示：不要在OnMessageReceived回调里做耗时操作（如写磁盘、网络请求），必须用异步队列（如Windows的PostQueuedCompletionStatus）把消息推到独立线程处理，否则会拖慢Steam Client主线程，导致UI卡顿。

3. SteamKit2：不是解析库，是“协议词典+执行引擎”

3.1 协议定义文件（.proto）的来源与可信度

SteamKit2的Protobufs/目录下有300+个.proto文件，比如steammessages_clientserver_2.proto。很多人以为这是Valve官方发布的，其实不然——它们全部来自社区逆向工程。最早一批由kisak-valve在2014年通过动态调试Steam Client导出，后续由SteamRE项目持续维护。我对比过2023年Steam Client更新后的实际网络包与steammessages_clientserver_2.proto定义，发现CMsgClientLogOnResponse里的uint32 eresult字段在新版中新增了EResult.ServiceUnavailable（值为118），而proto文件里只定义到117。这意味着：SteamKit2的proto定义永远滞后于Steam Client实际协议。解决方案不是等社区更新，而是用NetHook2抓取真实CMsgClientLogOnResponse的原始字节，用protoc --decode_raw手动解析，确认新字段位置后，反向补丁proto文件。例如，我抓到一个1a 02 76 00（tag=27, length=2, value=0x0076），查ASCII表知0x76=118，于是往proto里加一行：

optional uint32 eresult = 27 [default = 2];

再重新protoc --cpp_out=. *.proto生成C++代码。这个过程虽然麻烦，但保证了协议解析的100%准确——毕竟，你抓到的字节，才是唯一真相。

3.2 SteamKit2核心类的职责边界

SteamKit2里最常被误用的是SteamClient和SteamUnifiedMessages两个类。新手常以为SteamClient能直接发消息，其实它只负责底层连接管理（连接CM服务器、心跳保活、加密握手）。真正发业务消息的是SteamUnifiedMessages，它把CMsgClientLogOn这样的原始Protobuf消息，按Steam协议规范加上4字节长度头、2字节校验码、1字节消息类型，再交给SteamClient发送。我曾试图绕过SteamUnifiedMessages，直接用SteamClient.Send()发裸Protobuf，结果CM服务器返回EResult.InvalidProtocolBuffer。原因在于：Steam的CM服务器在解包时，会先校验消息头的CRC16（使用0x8408多项式），再检查Protobuf的msg_type是否在白名单内（如k_EMsg_ClientLogOn必须是322），最后才解析body。SteamUnifiedMessages内部封装了全部这些逻辑，而SteamClient只管传输。所以正确流程永远是：构造CMsgClientLogOn→ 调用SteamUnifiedMessages.Send(EMsg.ClientLogOn, msg)→ 等待SteamClient.OnMessage回调。漏掉任何一环，消息都会被静默丢弃。

3.3 GC（Game Coordinator）消息的特殊处理

GC消息（如CMsgGCSingle、CMsgGCSystemMessage）是SteamKit2里最难啃的部分。它不像Client-Server消息走公共CM通道，而是每个游戏有自己的GC服务器（如Dota2的GC在gc.dota2.com），且GC消息必须先通过CMsgClientGamesPlayed通知CM“我正在玩这个游戏”，CM才会把后续GC消息路由到对应GC服务器。我最初调试CS2库存同步时，一直收不到CMsgGCSingle回调，最后发现是忘了发CMsgClientGamesPlayed。正确顺序是：

登录成功后，立即发CMsgClientGamesPlayed，m_games_played[0].m_game_id = 730（CS2的AppID）
收到CMsgClientGamesPlayedResponse确认
再发CMsgGCSingle查询库存
没有第1步，GC服务器根本不会认你这个客户端。而且CMsgGCSingle的e_msg字段必须是k_EMsg_GCSingle（值为1101），不能写成k_EMsg_ClientToGC（那是旧协议）。这个细节在SteamKit2的文档里没提，但在SteamKit2/SteamKit2/Types/EMsg.cs源码注释里有说明：“GC messages require prior games played registration and strict EMsg enum matching”。

4. 从抓包到分析：构建可复现的Steam通信分析流水线

4.1 数据管道设计：NetHook2 → Named Pipe → SteamKit2 Parser

NetHook2捕获的消息不能直接喂给SteamKit2，因为二者进程空间隔离。我采用Windows命名管道（Named Pipe）作为中间件，设计如下流水线：

NetHook2在OnMessageReceived里，把message_id、message_body、timestamp序列化为JSON，通过CreateFileA("\\\\.\\pipe\\SteamHookPipe")写入管道
SteamKit2的分析程序（C#写的SteamAnalyzer.exe）用NamedPipeClientStream连接同一管道，实时读取JSON
解析JSON后，用SteamKit2.Protobufs.CMsgClientLogOnResponse.Parser.ParseFrom(body_bytes)生成强类型对象

这个设计的好处是解耦：NetHook2专注抓包，SteamKit2专注解析，两者可独立升级。测试时我发现一个致命问题：NetHook2写入速度（峰值2000 msg/s）远高于SteamAnalyzer读取速度（峰值800 msg/s），管道缓冲区溢出导致消息丢失。解决方案是启用管道的PIPE_TYPE_MESSAGE | PIPE_READMODE_MESSAGE模式，并在SteamAnalyzer端用BeginRead异步读取，同时增加双缓冲队列：

private readonly ConcurrentQueue<byte[]> _bufferQueue = new(); private void OnPipeRead(IAsyncResult ar) { var bytesRead = _pipeStream.EndRead(ar); if (bytesRead > 0) { var jsonBytes = new byte[bytesRead]; Array.Copy(_readBuffer, jsonBytes, bytesRead); _bufferQueue.Enqueue(jsonBytes); // 入队 } _pipeStream.BeginRead(_readBuffer, 0, _readBuffer.Length, OnPipeRead, null); }

这样即使瞬时流量激增，消息也会暂存在内存队列里，避免丢失。

4.2 关键通信场景的完整报文链路还原

以“好友上线通知”为例，完整链路涉及4次消息交互，NetHook2能捕获全部：

CM → Client:CMsgClientFriendMsgIncoming（消息体含uint64 steamid_friend,string message_body）
- 实测字段：steamid_friend = 76561198012345678,message_body = "Hey, you online?"
Client → CM:CMsgClientFriendMsgEcho（回执，含uint64 steamid_friend,uint64 msg_id）
- 注意：msg_id是客户端本地生成的单调递增ID，非服务端分配
CM → Client:CMsgClientFriendMsgEchoResponse（确认收到回执）
- 字段eresult = k_EResult_OK表示成功
Client → CM:CMsgClientAcknowledgeFriendMsg（最终确认，防止重复投递）
- 此消息无响应，发完即结束

这个链路揭示了一个重要事实：Steam的好友消息不是“发即达”，而是三段式可靠投递。如果第2步CMsgClientFriendMsgEcho丢失，客户端会在30秒后重发，CM会根据msg_id去重。NetHook2抓到的CMsgClientFriendMsgEcho里，msg_id字段是uint64类型，但实际值永远小于0xFFFFFFFF（32位），这是因为Steam客户端用GetTickCount64()低32位作为msg_id种子，避免ID碰撞。这个细节在SteamKit2的proto定义里没写，是我在抓1000条消息后统计出来的规律。

4.3 常见误判与真问题的区分方法

新手最容易把“协议行为”当成“Bug”。比如：

现象：NetHook2频繁捕获CMsgClientPing（每15秒一次），但CMsgClientPong极少出现
误判：以为Ping没发出去或Pong丢了
真相：CMsgClientPong是CM服务器在收到Ping后直接返回原消息体，不额外构造新消息。NetHook2的Hook点在序列化前，所以只捕获客户端发出的Ping，不捕获CM返回的Pong（因为Pong不在客户端内存里）。验证方法：用Wireshark抓包，过滤tcp.port == 27015，能看到00 00 00 00 00 00 00 00（8字节零填充的Pong）确实在Ping后100ms内返回。
另一个经典误判是CMsgClientLogOnResponse.eresult = 2（EResult.Invalid）。很多人以为账号密码错了，其实是CMsgClientLogOn里的uint32 cell_id字段填错了。Steam的cell_id是地理区域编码（如上海是101，北京是102），填错会导致CM服务器拒绝登录。NetHook2抓到的原始字节里，cell_id位于CMsgClientLogOn的第12~15字节（little-endian），我写了个小工具自动提取：

def extract_cell_id(pcap_file): with open(pcap_file, "rb") as f: data = f.read() # 找到CMsgClientLogOn的magic header: 0x00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 pos = data.find(b'\x00' * 16) if pos != -1: cell_id_bytes = data[pos + 12:pos + 16] return int.from_bytes(cell_id_bytes, 'little') return None

实测上海用户填101，登录成功率99.7%；填0，成功率0%。这个细节，Valve的文档里只字未提，全靠抓包+逆向。

5. 安全边界与合规红线：哪些事绝对不能做

5.1 Valve的反作弊机制如何识别异常行为

Steam的VAC（Valve Anti-Cheat）不仅扫描内存，还深度监控网络行为模式。我做过对照实验：用NetHook2+SteamKit2模拟“正常”好友消息（间隔>30秒，内容长度<200字符），连续运行72小时，VAC无反应；但一旦把消息间隔压到<5秒，或批量发送CMsgClientFriendMsgIncoming（单次>10条），15分钟后VAC进程就会弹出VAC was unable to verify your game session警告。根本原因是：VAC的vacsvc.dll会采样steamclient.dll的CMsgClientFriendMsgIncoming处理函数的调用频率，并与历史基线比对。基线数据来自数百万正版用户的真实行为——人类不可能每5秒发一条好友消息。更隐蔽的是，VAC还会检查CMsgClientLogOn里的uint32 login_key是否与当前硬件指纹匹配。NetHook2抓到的login_key是明文，但如果你把这个key复制到另一台机器上重放，VAC会在CMsgClientLogOnResponse返回前就终止连接。这不是协议层面的限制，而是VAC在TLS握手阶段就完成了硬件指纹校验。

5.2 用户协议中的明确禁止条款

Steam Subscriber Agreement第4.2条写得非常清楚：“You may not use any unauthorized third-party software that intercepts, ‘mines’ or otherwise accesses any data or information from or through the Steam Services.” 这里的“intercepts”直指NetHook2这类工具。但注意，条款针对的是“用于作弊或破坏服务”的行为，不是技术本身。我咨询过三位游戏行业律师，共识是：仅用于个人学习、协议研究、开发非分发型辅助工具（如本地库存备份脚本），不触犯法律；但若把抓包工具打包成EXE公开售卖，或用它绕过Steam支付系统，则必然违约。实际案例：2022年有个叫“SteamTradeSniper”的工具，用类似技术自动抢购稀有物品，Valve发函要求下架，理由正是此条款。所以我的建议是：所有NetHook2+SteamKit2项目，必须在README里加一句：“For educational and personal research purposes only. Not affiliated with or endorsed by Valve Corporation.” 这既是法律免责，也是职业底线。

5.3 生产环境部署的硬性约束

如果你真要把这套方案用在生产环境（比如公司内部的Steam账号健康度监控系统），必须遵守三条铁律：

进程隔离：NetHook2注入的steam.exe必须是专用账号的客户端，绝不能与员工日常使用的Steam客户端共用同一进程。我用Windows Sandbox创建隔离环境，每次分析启动全新Sandbox实例，确保内存干净。
流量节制：所有SteamKit2发起的请求，必须加Thread.Sleep(1000)限频。实测发现，CM服务器对单IP的CMsgClientInventoryUpdate请求有QPS限制（>3次/秒触发限流），返回EResult.LimitExceeded。
日志脱敏：NetHook2捕获的CMsgClientLogOnResponse含uint64 account_id和string webapi_token，这些必须在写入日志前用AES-256加密，密钥存于Windows DPAPI，绝不能明文落盘。我用ProtectedData.Protect()封装：

public static string EncryptLogEntry(string rawJson) { var bytes = Encoding.UTF8.GetBytes(rawJson); var encrypted = ProtectedData.Protect(bytes, null, DataProtectionScope.LocalMachine); return Convert.ToBase64String(encrypted); }

这条规则救过我两次——一次是日志服务器被黑，攻击者拿到的全是base64乱码；另一次是审计时，合规团队只要求提供加密日志样本，无需开放原始数据。

我在实际项目中发现，最实用的技巧不是多高深的技术，而是学会“看懂Steam的沉默”。比如NetHook2没捕获到预期消息，别急着改代码，先查Steam Client的日志文件logs/stdout.txt——里面会有[CM] Failed to send message to GC: timeout这样的提示，直接告诉你问题在GC连接，而不是协议解析。这种经验，文档里永远不会写，但能帮你省下三天调试时间。

查看全文

http://www.cnnetsun.cn/news/2521136.html