当前位置：首页 > news >正文

别再死记硬背L1、L2了！用Python+NumPy手把手带你画图理解Lp范数（附代码）

news 2026/5/30 20:30:59

用Python可视化Lp范数：从数学公式到动态图形的认知跃迁

第一次接触机器学习中的正则化时，那些神秘的L1、L2术语总让人望而生畏。与其死记硬背定义，不如打开Python，让代码带我们穿越数学的抽象迷雾。本文将用NumPy和Matplotlib构建一个交互式范数观察实验室，你会亲眼看到为什么L1能产生稀疏解而L2更适合平滑优化——这一切都藏在那些变换的几何形状中。

1. 理解Lp范数的几何本质

Lp范数不是一个枯燥的数学公式，而是一组会"变形"的几何图形。对于向量x=(x1,x2)，其Lp范数定义为( |x1|ᵖ + |x2|ᵖ )^(1/p)。当p取不同值时，单位球（范数等于1的所有点）会呈现神奇的变化：

import numpy as np def lp_norm(x, p): return np.sum(np.abs(x)**p, axis=-1)**(1/p)

表：常见p值对应的范数特性对比

p值	范数名称	数学表达式	几何形状	典型应用场景
0	L0范数	非零元素个数	离散点	特征选择（NP难问题）
1	L1范数	∑\|xᵢ\|	菱形	稀疏编码、LASSO
2	L2范数	√(∑xᵢ²)	圆形	岭回归、SVM
∞	L∞范数	max\|xᵢ\|	正方形	鲁棒优化

注意：实际编程中p不能为0，需要特殊处理。我们通常用接近0的小数(如0.1)来近似模拟L0特性。

2. 构建范数可视化实验室

让我们用Python创建一个动态观察系统，核心步骤分为坐标系准备、范数计算和图形绘制三个阶段。

2.1 准备可视化画布

首先建立网格坐标系，这是后续绘制等高线图的基础：

import matplotlib.pyplot as plt from matplotlib import cm # 创建二维网格 x = np.linspace(-1.5, 1.5, 500) y = np.linspace(-1.5, 1.5, 500) X, Y = np.meshgrid(x, y) XY = np.stack([X, Y], axis=-1) # 组合成坐标矩阵

2.2 动态绘制不同p值的单位球

通过滑动条交互观察p值变化时图形的连续变形：

from matplotlib.widgets import Slider fig, ax = plt.subplots(figsize=(8,8)) plt.subplots_adjust(bottom=0.25) # 初始绘制p=2时的单位球 p_init = 2 Z = lp_norm(XY, p_init) contour = ax.contour(X, Y, Z, levels=[1], colors='red') ax.set_aspect('equal') ax.grid(True) # 添加滑动条控件 ax_p = plt.axes([0.25, 0.1, 0.65, 0.03]) p_slider = Slider(ax_p, 'p值', 0.1, 10, valinit=p_init) def update(val): p = p_slider.val Z = lp_norm(XY, p) ax.clear() contour = ax.contour(X, Y, Z, levels=[1], colors='red') ax.set_title(f'L{p}范数单位球') ax.set_aspect('equal') ax.grid(True) fig.canvas.draw_idle() p_slider.on_changed(update) plt.show()

运行这段代码，你会看到一个可交互的图形窗口。拖动滑块时，可以观察到：

p→0+：图形向坐标轴收缩，体现L0的稀疏特性
p=1：完美的菱形（曼哈顿距离）
p=2：标准的圆形（欧氏距离）
p→∞：逐渐逼近正方形

3. 范数在机器学习中的实战意义

3.1 为什么L1能产生稀疏解

观察L1单位球的菱形结构，其顶点正好落在坐标轴上。当优化问题的解与这些顶点相交时，就会产生一个分量恰好为零的结果：

# 模拟L1和L2正则化的解空间对比 theta = np.linspace(0, 2*np.pi, 100) x1, y1 = np.cos(theta), np.sin(theta) # L2单位圆 x2, y2 = np.sin(theta), np.cos(theta) # L1单位菱形近似 fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(12,6)) # L2正则情况 ax1.plot(x1, y1, 'r', label='L2约束') ax1.plot([-1.5,1.5], [0.8,0.8], 'b--', label='优化目标') ax1.set_title('L2正则解不稀疏') # L1正则情况 ax2.plot(np.sign(x2)*np.abs(x2)**0.5, np.sign(y2)*np.abs(y2)**0.5, 'r', label='L1约束') ax2.plot([-1.5,1.5], [0.8,0.8], 'b--', label='优化目标') ax2.set_title('L1正则产生稀疏解') for ax in [ax1, ax2]: ax.legend() ax.set_aspect('equal') ax.grid(True) plt.show()

表：L1与L2正则化特性对比

特性	L1正则化	L2正则化
解稀疏性	高（顶点解）	低（平滑解）
计算复杂度	线性规划	解析解易得
抗噪声能力	较弱	较强
特征选择	自动选择	保留所有特征
适用场景	特征维度高但相关特征少	特征间相关性较强

3.2 从二维到高维的认知迁移

虽然我们只在二维空间可视化，但Lp范数的特性完美推广到高维空间：

在三维空间中，L1单位球变成八面体，L2变成标准球体
更高维度时，L1的"尖角"现象更加明显，稀疏解的概率大幅增加
L2则始终保持各向同性的平滑特性

# 三维L1和L2范数可视化 from mpl_toolkits.mplot3d import Axes3D phi = np.linspace(0, np.pi, 30) theta = np.linspace(0, 2*np.pi, 30) phi, theta = np.meshgrid(phi, theta) # 球坐标系转笛卡尔坐标 x = np.sin(phi) * np.cos(theta) y = np.sin(phi) * np.sin(theta) z = np.cos(phi) fig = plt.figure(figsize=(12,6)) ax1 = fig.add_subplot(121, projection='3d') ax1.plot_surface(x, y, z, color='blue', alpha=0.5) ax1.set_title('L2范数单位球(3D)') # L1近似八面体 vertices = np.array([ [1,0,0],[-1,0,0], [0,1,0],[0,-1,0], [0,0,1],[0,0,-1] ]) from scipy.spatial import ConvexHull hull = ConvexHull(vertices) ax2 = fig.add_subplot(122, projection='3d') for s in hull.simplices: s = np.append(s, s[0]) ax2.plot(vertices[s,0], vertices[s,1], vertices[s,2], 'r-') ax2.set_title('L1范数单位球(3D)') plt.show()

4. 进阶应用：自定义范数与弹性网络

理解了基础范数后，我们可以创造混合范数来解决更复杂的问题。弹性网络(Elastic Net)就是L1和L2的线性组合：

def elastic_net(x, alpha=0.5, l1_ratio=0.5): return alpha*l1_ratio*lp_norm(x,1) + alpha*(1-l1_ratio)*lp_norm(x,2) # 绘制不同混合比例的弹性网络 ratios = [0.2, 0.5, 0.8] plt.figure(figsize=(15,5)) for i, ratio in enumerate(ratios,1): Z = elastic_net(XY, l1_ratio=ratio) plt.subplot(1,3,i) plt.contour(X, Y, Z, levels=[1], colors='purple') plt.title(f'l1_ratio={ratio}') plt.grid(True) plt.gca().set_aspect('equal') plt.show()

实际工程中选择范数时需要考虑：