当前位置：首页 > news >正文

保姆级教程：用Python+Matplotlib可视化Ninapro DB2肌电信号（附完整代码）

news 2026/6/7 12:13:47

从零开始：Python解析Ninapro DB2肌电数据的可视化实战

在生物医学信号处理领域，肌电图（EMG）分析是理解肌肉活动与神经控制机制的重要窗口。Ninapro数据库作为公开可用的表面肌电信号基准数据集，为研究人员提供了宝贵的资源。本文将带您从数据下载到最终可视化，构建完整的分析流程。

1. 环境准备与数据获取

处理肌电信号需要特定的Python工具链。推荐使用Anaconda创建独立环境以避免依赖冲突：

conda create -n emg_analysis python=3.8 conda activate emg_analysis pip install numpy pandas matplotlib h5py scipy

Ninapro DB2数据集包含40名受试者的12通道表面肌电信号，采样率为2000Hz。数据以HDF5格式存储，这种二进制格式特别适合存储和访问大型科学数据集。从官方网站下载后，您会得到类似DB2_s1_refilter.h5的文件结构。

提示：建议将原始数据存放在项目目录的/data/raw子文件夹中，处理后的数据放在/data/processed中，保持文件结构清晰。

HDF5文件的结构可以通过以下代码快速浏览：

import h5py with h5py.File('DB2_s1_refilter.h5', 'r') as f: print("文件结构：") def print_attrs(name, obj): print(f"{name}: {dict(obj.attrs)}") f.visititems(print_attrs)

2. 数据加载与预处理

肌电信号通常包含高频噪声和基线漂移，预处理是确保分析质量的关键步骤。我们将采用以下标准化流程：

数据加载：使用h5py高效读取大型数据集
通道选择：明确要分析的肌肉通道
Z-score标准化：消除个体差异带来的幅度变化
带通滤波：保留20-500Hz的有用信号

import numpy as np from scipy import signal def load_emg_data(filepath, channels=range(12)): with h5py.File(filepath, 'r') as hf: emg_data = hf['alldata'][:, channels] return emg_data def preprocess_emg(data, sample_rate=2000): # 带通滤波 b, a = signal.butter(4, [20, 500], btype='bandpass', fs=sample_rate) filtered = signal.filtfilt(b, a, data, axis=0) # Z-score标准化 normalized = (filtered - np.mean(filtered, axis=0)) / np.std(filtered, axis=0) return normalized

表：常用肌电信号预处理方法对比

方法	优点	缺点	适用场景
Z-score标准化	保留原始分布	对异常值敏感	跨受试者比较
最小-最大归一化	限定输出范围	受极端值影响大	机器学习输入
中值归一化	抗异常值	计算复杂度高	实时处理

3. 多通道信号可视化技术

Matplotlib提供了强大的定制能力来展示多通道肌电信号。以下是创建出版级图表的技巧：

基础绘图代码框架：

import matplotlib.pyplot as plt from matplotlib.gridspec import GridSpec def plot_emg_channels(data, start_sample=0, duration=1.0, sample_rate=2000): num_channels = data.shape[1] end_sample = start_sample + int(duration * sample_rate) segment = data[start_sample:end_sample, :] fig = plt.figure(figsize=(15, 10), dpi=300) gs = GridSpec(num_channels, 1, hspace=0) time_axis = np.linspace(0, duration, segment.shape[0]) for i in range(num_channels): ax = fig.add_subplot(gs[i, 0]) ax.plot(time_axis, segment[:, i], linewidth=0.5) ax.set_ylabel(f'Ch{i+1}', rotation=0, ha='right', va='center') ax.set_yticks([]) if i != num_channels - 1: ax.set_xticks([]) else: ax.set_xlabel('Time (s)') plt.tight_layout() return fig

图表的专业优化建议：

使用GridSpec替代subplot实现紧凑布局
采用科研期刊推荐的字体（如Times New Roman）
保持Y轴刻度一致便于通道间比较
添加适当的留白避免视觉拥挤

注意：当处理长时间序列时，建议分段可视化。完整显示数小时的原始信号既无必要也会导致内存问题。

4. 动作识别与事件标注可视化

Ninapro DB2包含了动作标签信息，将原始信号与动作标注同步显示能增强可视化信息量：

def plot_emg_with_actions(emg_data, labels, sample_rate=2000): fig, (ax1, ax2) = plt.subplots(2, 1, figsize=(15, 6), sharex=True, gridspec_kw={'height_ratios': [3, 1]}) # 绘制EMG信号 time = np.arange(len(emg_data)) / sample_rate for ch in range(emg_data.shape[1]): ax1.plot(time, emg_data[:, ch] - 4*ch, linewidth=0.7) # 绘制动作标签 unique_labels = np.unique(labels[labels != 0]) color_map = plt.cm.get_cmap('tab20', len(unique_labels)) for i, label in enumerate(unique_labels): mask = labels == label ax2.fill_between(time, 0, 1, where=mask, color=color_map(i), alpha=0.3, label=f'Action {label}') ax1.set_ylabel('Normalized EMG') ax2.set_ylabel('Actions') ax2.set_yticks([]) ax2.legend(bbox_to_anchor=(1.05, 1), loc='upper left') plt.tight_layout() return fig

常见可视化问题解决方案：

信号重叠难以分辨：
- 采用垂直偏移策略（如代码中的-4*ch）
- 使用半透明颜色叠加
- 交互式缩放工具（考虑Plotly版本）

时间轴过长导致细节丢失：

plt.figure(figsize=(20, 6)) plt.plot(data[10000:12000, :]) # 聚焦特定时间段

多受试者数据对比：

def plot_comparison(subject1, subject2): fig, axes = plt.subplots(2, 1, sharex=True) axes[0].plot(subject1[:, 0], label='Subject 1') axes[1].plot(subject2[:, 0], label='Subject 2') # 添加统一图例和标签

5. 高级可视化与导出技巧

当需要将可视化结果用于论文或报告时，输出质量至关重要。以下是一些专业建议：

矢量图形导出设置：

plt.savefig('emg_plot.svg', format='svg', bbox_inches='tight', dpi=1200) plt.savefig('emg_plot.eps', format='eps', transparent=True)

样式配置最佳实践：

plt.style.use('seaborn-paper') # 学术风格 plt.rcParams.update({ 'font.family': 'serif', 'font.serif': ['Times New Roman'], 'axes.titlesize': 12, 'axes.labelsize': 10, 'xtick.labelsize': 8, 'ytick.labelsize': 8, 'figure.autolayout': True })

交互式探索工具：

from matplotlib.widgets import Slider fig, ax = plt.subplots() plt.subplots_adjust(bottom=0.25) ax.plot(emg_data[:, 0]) ax_slider = plt.axes([0.2, 0.1, 0.6, 0.03]) slider = Slider(ax_slider, 'Channel', 0, 11, valinit=0, valstep=1) def update(val): ax.clear() ax.plot(emg_data[:, int(slider.val)]) fig.canvas.draw_idle() slider.on_changed(update)

在实际项目中，我发现将常用可视化函数封装成类可以大大提高效率。例如创建一个EMGVisualizer类，包含数据加载、预处理和多种绘图方法，这样只需初始化一次就能生成各种图表。

查看全文

http://www.cnnetsun.cn/news/2807169.html