当前位置：首页 > news >正文

Python进阶：从执行模型与对象机制理解真实Bug根源

news 2026/6/13 18:31:02

1. 这不是又一本Python入门书——它解决的是你写完100行代码后才真正浮现的困惑

“Understanding Python: Part 3”这个标题乍看平平无奇，像极了被遗忘在技术博客角落的系列续篇。但如果你已经写过爬虫、搭过Flask小站、用pandas处理过几份Excel报表，甚至调试过三次以上UnboundLocalError却仍说不清为什么局部变量会“突然失效”，那你大概率正站在Part 3该出现的位置上——不是语法扫盲阶段，而是认知断层带：你知道怎么写，但不知道Python底层“怎么想”；你能跑通代码，但改一行就崩，且完全猜不到崩在哪一层。

我带过二十多期Python实战训练营，发现一个高度一致的现象：学员卡点从不发生在print("Hello")，而集中在第3天之后——当他们第一次尝试自己封装类、第一次用__slots__优化内存、第一次在装饰器里写functools.wraps、第一次面对asyncio.run()报错却查不到协程栈时，那种“语法都对，逻辑也通，但就是不工作”的窒息感，才是Part 3真正的靶心。它不教你怎么打印九九乘法表，它专治“明明抄了文档代码，运行却报错”的顽疾；它不讲for循环怎么写，它拆解for背后__iter__和__next__如何被解释器自动调用；它不罗列*args和**kwargs的语法规则，它告诉你为什么Django的视图函数能同时接收URL参数、请求对象和自定义关键字参数——全靠这一对符号在调用链路上做的“参数解包接力”。

这个Part 3，本质是一张Python执行现场的高清解剖图。它把CPython解释器、字节码、命名空间、作用域链、对象生命周期这些藏在python命令背后的黑箱，一帧一帧拆给你看。你不需要编译源码，但得知道def语句执行时，函数对象是怎么被创建、闭包环境是怎么被捕获、默认参数列表为何是“可变陷阱”的温床。它面向的不是零基础新手，而是那些已经能写出功能代码、却总在进阶时撞墙的实践者——比如你刚用multiprocessing跑多进程，结果发现共享变量没更新，查半天才发现Manager和Value根本不是一回事；比如你重构类时把方法抽成独立函数，结果self报错，却没意识到@staticmethod和@classmethod的调用机制差异远不止少写个self这么简单。

所以，别把它当成教程章节，它更像一份Python开发者自查手册：当你写的代码行为和预期不符，当你读开源库源码看到__getattribute__绕晕，当你想优化性能却不知从何下手——Part 3提供的不是答案，而是你自己的调试显微镜。它不承诺让你速成高手，但它能确保你下次再遇到AttributeError: 'NoneType' object has no attribute 'xxx'时，第一反应不再是盲目加if obj is not None:，而是立刻检查对象初始化路径是否被__new__短路、或__init__是否因异常提前退出。这才是“理解”的真实分量：不是记住规则，而是预判规则失效的边界。

2. 内容整体设计与思路拆解：为什么必须从“对象模型”切入，而不是继续讲语法糖？

2.1 拒绝“语法-示例-练习”三板斧：直击高阶障碍的根源性设计

市面上90%的Python进阶内容，依然沿用入门教材的惯性逻辑：先讲一个新语法（比如:=海象运算符），给三个例子，再出两道题让你练熟。这种结构对初学者友好，但对已具备实战经验的开发者，恰恰是效率黑洞。为什么？因为你卡住的地方，从来不是“这个符号怎么写”，而是“为什么在这里用它反而让代码更难懂”“为什么用map()替换for循环后性能下降了30%”。Part 3的设计起点，就是彻底抛弃“语法驱动”路径，转向问题驱动+机制溯源双轨并行。

我们不从@property开始讲，而是从一个真实场景切入：你写了一个User类，要求email字段必须是合法邮箱格式，且修改时需触发通知。你本能地写了@property和@email.setter，但很快发现：当从数据库批量加载用户时，email属性被反复赋值，通知发了上百次。这时，单纯记住@property的写法毫无意义——你需要知道@property本质是data descriptor的一种，它的__set__方法会在每次赋值时被调用，而描述符协议的触发时机，取决于属性查找链（instance dict → class dict → parent classes）的完整流程。Part 3的每一章，都以这类“意料之外的行为”为锚点，倒推其底层机制。这种设计不是炫技，而是因为所有高阶问题——内存泄漏、多线程竞态、序列化失败、装饰器失效——最终都能归结到对Python对象模型、执行模型、内存模型的某处误解。

2.2 为什么“对象模型”是唯一不可绕过的基石？

很多开发者认为“理解对象模型”是理论家的事，写业务代码用不到。我用一个血泪案例打碎这个幻觉：去年帮一家做IoT数据平台的客户排查一个诡异Bug——他们的设备状态类DeviceState在长时间运行后，内存占用持续上涨，GC也清理不掉。团队花了两周查内存快照，最后发现罪魁祸首是一段看似无害的代码：

class DeviceState: def __init__(self, device_id): self.device_id = device_id self._cache = {} # 缓存最近计算结果 def calculate(self, param): key = f"{param}_v2" if key not in self._cache: self._cache[key] = expensive_computation(param) return self._cache[key]

问题出在哪？_cache字典本身不会导致泄漏，但expensive_computation返回的对象，内部持有了对DeviceState实例的强引用（通过闭包或回调注册），而DeviceState实例又通过self._cache持有这些对象——形成循环引用。CPython的引用计数能处理大部分情况，但涉及list、dict、function等容器类型时，循环引用需要GC介入。而GC的触发阈值、代际回收策略、以及__del__方法的执行时机，全部依赖于你对对象模型中“引用关系”“生命周期管理”“垃圾回收机制”的理解。如果只停留在“self._cache = {}是清空缓存”的表层认知，这个Bug永远找不到根因。

因此，Part 3将“Python对象模型”作为开篇核心，不是为了讲object基类有多伟大，而是要厘清：

一切皆对象，但“对象”在内存中究竟是什么结构？（PyObject头、引用计数、类型指针）
is和==的区别，为什么[] is []是False而a = []; b = a; a is b是True？这直接关联到对象标识（identity）与值相等（equality）的底层实现。
__dict__和__slots__如何影响实例的内存布局？为什么启用__slots__能减少40%内存占用？这关系到你设计高频创建类（如游戏实体、日志对象）时的性能取舍。

这些不是“知道就好”的 trivia，而是你每天写代码时，解释器默默执行的底层契约。Part 3的设计逻辑很朴素：不理解契约，就无法预测违约后果；不预测后果，就只能靠试错填坑。

2.3 为什么跳过“装饰器”“生成器”等热门话题，先啃“执行上下文”这块硬骨头？

观察大量线上答疑记录，我发现一个反直觉现象：“装饰器”“生成器”“异步IO”这些被教程反复强调的“高级特性”，实际出错率远低于“作用域”“命名空间”“模块导入机制”。原因很简单：前者有明确语法标记（@、yield、async/await），错误信息相对友好；后者却像空气一样无处不在，错误信息却指向八竿子打不着的地方。比如这个经典陷阱：

funcs = [] for i in range(3): funcs.append(lambda: i) print([f() for f in funcs]) # 输出 [2, 2, 2]，而非预期 [0, 1, 2]

几乎所有初学者都栽过，教程也都会讲“闭包捕获的是变量引用而非值”。但Part 3要追问：为什么是引用？这个“引用”具体指什么？它存储在闭包的哪个结构里？当lambda执行时，解释器如何从当前帧（frame）中找到i的值？这直接引向frame object的结构、f_locals字典的构建时机、以及LOAD_DEREF字节码指令的工作原理。如果不深挖到执行上下文层面，你永远只能记住“用默认参数lambda x=i: x来捕获值”，却无法举一反三：为什么threading.Thread(target=lambda: print(i))在多线程下可能输出乱序？为什么functools.partial能安全绑定参数而普通闭包不行？

所以Part 3的章节排序，本质是一张认知风险地图：优先攻克那些错误隐蔽、调试困难、影响面广的底层机制。执行上下文（Execution Context）排在第二位，正是因为它贯穿了函数调用、异常传播、生成器挂起恢复、协程调度等所有关键场景。理解它，等于拿到了解读Python运行时行为的通用密钥。后续的装饰器、生成器、异步IO，不过是这个密钥在不同场景下的应用范例——你不再需要死记硬背@wraps的作用，因为你知道functools.wraps本质是复制源函数的__name__、__doc__等到目标函数的__dict__中，以确保inspect.signature()等工具能正确解析；你也不再困惑yield from和await的区别，因为二者都在操作同一个frame对象的f_lasti（最后执行指令索引）和f_stacktop（栈顶指针）。

3. 核心细节解析与实操要点：从字节码到命名空间，手把手拆解Python的“思考过程”

3.1 字节码：Python解释器的“思维草稿”，读懂它才能预判执行流

很多人以为Python是“解释型语言”就等于“边读边执行”，这是巨大误解。CPython的实际流程是：源码 → 词法分析 → 语法分析 →生成字节码（.pyc文件）→ 解释器执行字节码。字节码才是Python真正的“中间语言”，它比源码更接近机器指令，也比源码更能暴露执行逻辑的本质。Part 3不教你背LOAD_FAST、STORE_GLOBAL这些指令名，而是带你用dis模块，像读侦探小说一样追踪一段代码的每一步“心理活动”。

以最简单的x = 1为例：

import dis def simple_assign(): x = 1 dis.dis(simple_assign)

输出：

2 0 LOAD_CONST 1 (1) 2 STORE_FAST 0 (x) 4 LOAD_CONST 0 (None) 6 RETURN_VALUE

表面看只是赋值，但字节码揭示了三层隐藏动作：

常量池加载：LOAD_CONST 1 (1)—— 解释器先从函数的__code__.co_consts常量元组中取出索引为1的值（即整数1）。注意，co_consts[0]永远是None，这是Python函数的返回值默认值。
局部变量存储：STORE_FAST 0 (x)—— 将值存入局部变量数组（f_locals）的索引0位置。这里FAST意味着使用快速访问路径（基于索引的数组访问），而非慢速的字典查找。这也是为什么在函数内访问局部变量比全局变量快——全局变量需查globals()字典，而局部变量是数组索引。
隐式返回：最后两行LOAD_CONST 0 (None)和RETURN_VALUE，证明了Python函数没有return语句时，默认返回None，且这个None来自常量池，而非动态创建。

现在看一个更典型的“坑”：list.append()的字节码：

def append_demo(): lst = [1, 2] lst.append(3) dis.dis(append_demo)

关键部分：

2 LOAD_NAME 0 (lst) 4 LOAD_ATTR 1 (append) 6 LOAD_CONST 2 (3) 8 CALL_FUNCTION 1 10 POP_TOP

重点在LOAD_ATTR 1 (append)：它不是直接调用list.append，而是先从lst对象中获取append属性（一个绑定方法对象），再调用。这意味着append方法的查找发生在运行时，且每次调用都要走一遍属性查找链。如果你在循环中频繁调用lst.append()，可以预先提取方法：append = lst.append; for x in data: append(x)。字节码会变成LOAD_FAST（查局部变量数组）而非LOAD_ATTR，性能提升可达15%-20%。这不是玄学优化，而是字节码层面的必然结果。

提示：dis是你的第一道防线。当代码行为诡异时，先dis一下。比如你怀疑装饰器没生效，dis被装饰函数，看CALL_FUNCTION指令是否包裹在装饰器逻辑中；比如你好奇f"{x}"和str(x)哪个快，dis两者，看前者是否多出FORMAT_VALUE和BUILD_STRING指令——答案是f-string更快，因为它在编译期就确定了字符串结构，而str()需运行时调用__str__方法。

3.2 命名空间与作用域：四层嵌套的“寻宝地图”，找错变量名就是迷路

Python的LEGB规则（Local → Enclosing → Global → Built-in）人尽皆知，但多数人只把它当口诀背，却不知每个层级在内存中对应什么结构。Part 3将命名空间具象为一张可触摸的“寻宝地图”，每层都是一个真实的Python字典对象：

Local（L）：函数执行时创建的frame.f_locals字典。注意！它在函数执行期间是f_locals的副本，修改它（如f_locals['x'] = 5）不会影响实际局部变量。这是CPython的优化设计，避免频繁字典操作拖慢性能。
Enclosing（E）：外层函数的f_locals，但仅对嵌套函数可见。它被存储在闭包对象（cell）中，cell.contents指向实际值。这就是为什么闭包能“记住”外层变量——它持有的是cell对象，而非变量值本身。
Global（G）：模块级别的globals()字典，即.py文件顶层的命名空间。import语句、class定义、顶层变量都存在这里。
Built-in（B）：builtins模块的__dict__，包含len、print、range等内置函数。它是最外层，也是最后查找的层级。

验证这个模型：写一个嵌套函数，然后在内层函数中打印各层命名空间：

x = "global" def outer(): x = "enclosing" def inner(): x = "local" print("Local:", locals()) # {'x': 'local'} print("Enclosing:", [c.cell_contents for c in inner.__closure__]) # ['enclosing'] print("Global:", globals()['x']) # 'global' print("Built-in:", __builtins__.len) # <built-in function len> inner() outer()

这个实验直观展示了四层空间的物理存在。而所有“变量未定义”错误，本质都是在这张地图上“寻宝失败”。比如NameError: name 'x' is not defined，就是解释器按LEGB顺序查完四层字典，都没找到键'x'。更隐蔽的错误是UnboundLocalError：当你在函数内对变量x赋值（如x = x + 1），解释器会将x标记为局部变量，后续所有对x的读取都只查Local层。如果此时Local层尚未初始化x（即赋值语句还没执行到），就读取就会报UnboundLocalError。这不是bug，而是Python为优化局部变量访问速度做的强制约定——它假设“被赋值的变量就是局部的”，从而跳过Global层的字典查找。

注意：global和nonlocal声明，本质是告诉解释器：“请跳过Local层，直接去Global/Enclosing层查找并修改这个变量”。它们不是创建新变量，而是改变变量查找的起始层。滥用global会导致模块级状态污染，而nonlocal在深度嵌套时易引发逻辑混乱——Part 3建议：优先用参数传递和返回值，而非跨层修改变量。

3.3 对象生命周期：从创建到销毁，一场关于引用计数与GC的精密舞蹈

Python的内存管理常被简化为“自动垃圾回收”，但真相是一场由引用计数（primary）和循环垃圾收集器（secondary）共同完成的精密协作。Part 3不讲抽象概念，而是用sys.getrefcount()和gc模块，带你实时观测对象的“生老病死”。

先看引用计数的核心规则：每个对象都有一个ob_refcnt字段，记录指向它的引用数量。当ob_refcnt降为0，对象立即被销毁（__del__被调用，内存被释放）。测试一下：

import sys a = [1, 2, 3] print(sys.getrefcount(a)) # 输出 2（a本身 + getrefcount的临时引用） b = a print(sys.getrefcount(a)) # 输出 3（a, b, getrefcount） del b print(sys.getrefcount(a)) # 输出 2（a, getrefcount）

注意getrefcount本身会增加一次引用，所以基准值总是比你预期多1。这个机制高效，但有个致命短板：无法处理循环引用。比如：

class Node: def __init__(self, value): self.value = value self.parent = None self.children = [] a = Node("a") b = Node("b") a.children.append(b) b.parent = a # 形成 a → b → a 循环引用 del a, b # 此时a和b的refcount都不为0（a被b.parent引用，b被a.children引用）

此时a和b的引用计数均大于0，引用计数器无法回收它们。这就是循环垃圾收集器（GC）的用武之地。GC定期扫描所有对象，找出“不可达”的循环引用组（即无法从根对象——如全局变量、栈帧中的局部变量——到达的对象），并将其回收。

但GC不是万能的。它有三大限制：

延迟性：GC不会立即运行，它有自己的触发阈值（可通过gc.get_threshold()查看，默认700/10/10，表示当0代对象新增700个时触发0代回收）。
__del__的不确定性：在循环引用中，__del__方法的调用时机由GC决定，且可能在程序退出时才被调用，甚至不被调用（如果GC被禁用）。
C扩展的兼容性：某些C扩展（如NumPy数组）可能绕过Python的引用计数，需手动管理内存。

因此，Part 3强调：不要依赖__del__做关键资源清理。正确的做法是使用上下文管理器（with语句）或显式close()方法。例如，文件操作必须用with open(...) as f:，因为__del__无法保证文件句柄及时关闭，而with语句的__exit__方法在离开代码块时必然执行。

实操心得：排查内存泄漏的黄金组合是tracemalloc+gc。tracemalloc.start()开启跟踪，运行可疑代码，然后snapshot = tracemalloc.take_snapshot()，用snapshot.filter_traces(...)过滤出分配最多的文件行。这比盲目看psutil.Process().memory_info()有效十倍。我曾用此法在一个Web服务中定位到，某个日志装饰器在每次请求时创建了未被清除的weakref，导致Request对象无法被GC回收。

4. 实操过程与核心环节实现：用真实项目复现，从字节码分析到性能调优的完整闭环

4.1 场景还原：一个电商订单系统的性能瓶颈诊断与优化

我们以一个真实的电商后台订单查询接口为案例，完整走一遍Part 3的实操闭环。接口需求：根据用户ID查询其最近100笔订单，并按时间倒序排列。初始代码如下：

# order_service.py from datetime import datetime from typing import List, Dict def get_user_orders(user_id: int) -> List[Dict]: # 模拟从数据库获取原始订单数据（实际是SQL查询） raw_orders = fetch_from_db(user_id) # 返回 list[dict]，含 id, amount, created_at 等字段 # 业务逻辑：过滤掉已取消订单，转换created_at为datetime对象 orders = [] for order in raw_orders: if order["status"] != "cancelled": order["created_at"] = datetime.fromisoformat(order["created_at"]) orders.append(order) # 排序：按created_at倒序 orders.sort(key=lambda x: x["created_at"], reverse=True) # 取前100条 return orders[:100]

上线后监控显示，当user_id对应订单数超过5000时，接口P95延迟飙升至2秒以上。团队第一反应是“SQL慢”，但EXPLAIN显示查询本身仅耗时20ms。问题显然在Python层。

步骤1：用`dis`定位热点字节码

对get_user_orders函数执行dis.dis(get_user_orders)，重点关注循环和排序部分。关键发现：

for order in raw_orders:对应GET_ITER+FOR_ITER指令，正常。
order["status"] != "cancelled"中的order["status"]是BINARY_SUBSCR（字典键查找），成本可控。
最大嫌疑是orders.sort(...)：sort方法调用会触发CALL_FUNCTION，而key=lambda x: x["created_at"]是一个闭包，每次比较都要执行LOAD_ATTR和LOAD_CONST。当排序5000个元素，比较次数约O(n log n) ≈ 5000 * 13 = 65000次，每次都要解析lambda闭包——这就是瓶颈！

步骤2：用`cProfile`量化验证

import cProfile cProfile.run('get_user_orders(123)', sort='cumulative')

输出确认：sort方法占总耗时78%，其中<lambda>占sort耗时的92%。

步骤3：针对性优化——从字节码层面重构

方案A（推荐）：预提取排序键，避免闭包调用

def get_user_orders_optimized(user_id: int) -> List[Dict]: raw_orders = fetch_from_db(user_id) orders = [] # 预提取created_at列表，避免lambda闭包 timestamps = [] for order in raw_orders: if order["status"] != "cancelled": dt = datetime.fromisoformat(order["created_at"]) order["created_at"] = dt orders.append(order) timestamps.append(dt) # 同时存时间戳 # 用zip打包orders和timestamps，按timestamps排序 sorted_pairs = sorted(zip(orders, timestamps), key=lambda x: x[1], reverse=True) return [pair[0] for pair in sorted_pairs][:100]

方案B（更优）：用operator.itemgetter替代lambda

from operator import itemgetter # ... 在过滤后 orders.sort(key=itemgetter("created_at"), reverse=True) # itemgetter是C实现，比lambda快3倍

方案C（终极）：数据库层排序，Python只做切片

# 修改SQL：ORDER BY created_at DESC LIMIT 100 raw_orders = fetch_from_db_sorted(user_id) # SQL已排序且限制100条 # 后续只需过滤取消订单，无需排序

实测结果（5000订单数据）：

方案	P95延迟	优化幅度
原始	2150ms	-
方案A	890ms	58%
方案B	620ms	71%
方案C	45ms	98%

关键洞察：优化不是靠“猜”，而是靠dis和cProfile定位到字节码和函数级瓶颈。方案C之所以最快，是因为它把O(n log n)的排序从Python层转移到了数据库（通常用B+树索引，复杂度O(log n)），且只传输100条结果，网络IO也大幅降低。这印证了Part 3的核心主张：理解执行模型，才能做出架构级决策，而非仅限于代码微调。

4.2 工具链配置：打造你的Python“显微镜”工作台

Part 3的实操价值，高度依赖一套趁手的诊断工具链。以下是我十年实战沉淀的最小可行配置，全部基于标准库，无需安装第三方包：

必备工具1：`dis`+`inspect`组合拳

dis.dis(func)：查看函数字节码。
inspect.getsource(func)：获取源码（需.py文件存在）。
inspect.signature(func)：获取函数签名，包括参数类型、默认值、注解。
inspect.currentframe()：获取当前帧对象，用于调试作用域问题。

必备工具2：`sys`和`gc`深度探针

sys.getsizeof(obj)：获取对象内存大小（注意：对容器类型只返回自身开销，不含元素）。
sys.getrefcount(obj)：查看引用计数（记得减1）。
gc.get_objects(generation=0)：获取指定代的所有对象，用于分析内存分布。
gc.set_debug(gc.DEBUG_STATS)：开启GC调试，运行时打印回收统计。

必备工具3：`tracemalloc`内存追踪仪

import tracemalloc tracemalloc.start() # 执行可疑代码 result = get_user_orders(123) # 获取内存快照 snapshot = tracemalloc.take_snapshot() top_stats = snapshot.statistics('lineno') # 按代码行统计 for stat in top_stats[:10]: print(stat)

输出示例：

order_service.py:45: size=2.4 MiB, count=12000, average=208 B # 创建了12000个datetime对象 utils.py:12: size=1.8 MiB, count=9000, average=200 B # 字典对象

必备工具4：`timeit`精确计时器

不要用time.time()，用timeit.timeit，它会自动处理多次运行、排除系统干扰：

import timeit # 比较两种列表推导式 time1 = timeit.timeit('[x*2 for x in range(1000)]', number=1000000) time2 = timeit.timeit('list(map(lambda x: x*2, range(1000)))', number=1000000) print(f"List comp: {time1:.4f}s, Map: {time2:.4f}s") # 通常list comp快2-3倍

实操心得：把上述工具写成一个debug_helper.py，放在项目根目录。每次遇到性能或行为问题，第一反应不是改代码，而是运行python debug_helper.py --func get_user_orders --profile。养成这个习惯，你的调试效率会比同行高出一个数量级。工具本身不创造价值，但能让你把时间花在真正重要的地方——理解问题本质，而非重复试错。

5. 常见问题与排查技巧实录：那些只有踩过坑才懂的“幽灵错误”与避坑指南

5.1 “幽灵错误”速查表：10个高频诡异问题的根因与解法

问题现象	表层表现	根本原因（Part 3视角）	快速验证方法	终极解法
1.`UnboundLocalError`	“local variable 'x' referenced before assignment”	函数内对变量赋值，触发Python将其标记为局部变量，但读取发生在赋值前	在报错行前加`print(locals())`，看`x`是否在字典中	用`global x`或`nonlocal x`声明，或重构为参数传递
2.`AttributeError`on`None`	“'NoneType' object has no attribute 'xxx'”	对象初始化失败（`__init__`抛异常）、或`__new__`返回`None`、或链式调用中某步返回`None`	`print(type(obj), obj)`，确认`obj`是否为`None`；用`pdb`在调用链上设断点	在链式调用前加`if obj is not None:`，或用`getattr(obj, 'xxx', default)`
3.`ImportError: cannot import name 'X'`	模块导入失败，但`X`明明存在	循环导入：A.py导入B.py，B.py又导入A.py，导致A.py未完全执行完就被B.py引用	在A.py开头加`print("A loading...")`，B.py同理，看打印顺序	重构模块，将共享代码抽到第三模块C.py；或用`import A`代替`from A import X`
4. 多线程下`list.append()`不生效	主线程看不到子线程添加的元素	`list`是线程安全的（CPython GIL保证），但若子线程操作的是局部变量而非共享对象，则主线程无法访问	`print(threading.current_thread().name, id(my_list))`，确认是否同一对象	使用`threading.local()`创建线程局部存储，或用`queue.Queue`进行线程间通信
5.`datetime`对象JSON序列化失败	`TypeError: Object of type datetime is not JSON serializable`	`json.dumps()`只支持基本类型（`str`,`int`,`list`,`dict`等），`datetime`需自定义`default`函数	`json.dumps(obj, default=str)`测试是否能转为字符串	自定义`JSONEncoder`，重写`default`方法，将`datetime`转为ISO格式字符串
6. 装饰器丢失原函数元信息	`help(decorated_func)`显示装饰器函数的帮助，而非原函数	`@wraps`未使用，导致`decorated_func.__name__`、`__doc__`等被覆盖	`print(decorated_func.__name__)`，看是否为装饰器名	在装饰器内使用`@functools.wraps(func)`包装返回函数
7.`__slots__`启用后无法动态添加属性	`AttributeError: 'X' object has no attribute 'y'`	`__slots__`禁用了`__dict__`，实例只能拥有`slots`中声明的属性	`print(hasattr(obj, '__dict__'))`，应为`False`	移除`__slots__`，或在`slots`中添加`'__dict__'`（牺牲内存优势）
8.`asyncio`协程不执行	`coroutine object get_data at 0x...`而非实际结果	忘记`await`或`asyncio.run()`，协程对象未被调度	`print(type(coroutine_obj))`，确认是`coroutine`类型	用`await coroutine_obj`（在async函数内），或`asyncio.run(coroutine_obj)`（顶层）
9.`pickle`序列化失败	`AttributeError: Can't pickle local object`	尝试序列化嵌套函数、lambda、或未定义在模块顶层的类	`print(pickle.dumps(lambda x: x))`测试	将函数定义移到模块顶层，或用`dill`库（支持更多类型）
10.`sys.path`修改不生效	`ImportError`依旧，新路径未被搜索	`sys.path`修改只影响后续导入，已缓存的模块（`sys.modules`）不受影响	`print(sys.path)`，确认路径已添加；`print(list(sys.modules.keys()))`，看模块是否已加载	重启Python解释器；或用`importlib.reload(module)`重新加载模块