当前位置：首页 > news >正文

用Python和NumPy手把手实现一个马尔可夫链预测模型（附股市预测代码）

news 2026/6/1 23:29:26

用Python和NumPy手把手实现一个马尔可夫链预测模型（附股市预测代码）

马尔可夫链的魅力在于它用数学的简洁性捕捉了现实世界中的复杂动态。想象一下，你正在观察一只在迷宫中穿梭的小鼠，它的下一个转弯选择只取决于当前所在的位置，而与之前走过的路径无关——这就是马尔可夫思维的精髓。在金融领域，这种"无记忆性"的特性恰好能模拟股价的随机游走，让我们得以窥见市场未来的可能形态。

本文将带您从零构建一个完整的马尔可夫链模型，使用Python的NumPy库实现状态转移矩阵的运算，并最终应用于股市趋势预测。不同于理论讲解，我们会聚焦于可运行的代码实现和直观的结果可视化，让抽象的概率概念转化为可触摸的计算结果。您将学到如何用不到50行代码搭建一个真正的预测系统，并理解其背后的数学原理。

1. 环境准备与基础概念

在开始编码之前，我们需要确保环境配置正确。建议使用Python 3.8+版本，并安装以下库：

pip install numpy matplotlib pandas

马尔可夫链的核心是状态转移矩阵，它定义了系统从一个状态转移到另一个状态的概率。以股市为例，我们可以定义三种状态：

牛市（Bull Market）：股价持续上涨
熊市（Bear Market）：股价持续下跌
横盘（Sideways Market）：股价波动较小

注意：状态划分需要根据具体场景调整，更精细的状态划分（如添加"小幅上涨"等）能提高模型精度，但会增加计算复杂度。

2. 构建状态转移矩阵

让我们用NumPy创建一个典型的状态转移矩阵。假设历史数据显示：

牛市后有90%概率保持牛市，7.5%概率转为熊市，2.5%概率转为横盘
熊市后有15%概率转为牛市，80%概率保持熊市，5%概率转为横盘
横盘后有25%概率转为牛市或熊市，50%概率保持横盘

import numpy as np transition_matrix = np.array([ [0.9, 0.075, 0.025], # 牛市转移概率 [0.15, 0.8, 0.05], # 熊市转移概率 [0.25, 0.25, 0.5] # 横盘转移概率 ])

验证矩阵有效性非常重要，每行概率之和必须为1：

print("行求和检查:", np.sum(transition_matrix, axis=1)) # 输出应为：[1. 1. 1.]

3. 状态预测与可视化

初始状态分布为[0.3, 0.4, 0.3]，即30%牛市、40%熊市、30%横盘。我们可以预测未来100天的状态演变：

import matplotlib.pyplot as plt current_state = np.array([0.3, 0.4, 0.3]) history = [current_state.copy()] for _ in range(100): current_state = np.dot(current_state, transition_matrix) history.append(current_state.copy()) history = np.array(history) plt.plot(history[:, 0], label='Bull Market') plt.plot(history[:, 1], label='Bear Market') plt.plot(history[:, 2], label='Sideways') plt.xlabel('Days') plt.ylabel('Probability') plt.legend() plt.show()

运行这段代码，您将看到概率分布如何随时间收敛到稳定状态。典型的输出结果会显示，约60天后分布稳定在[0.625, 0.3125, 0.0625]。

4. 实战：股市预测模型

现在我们将模型应用于真实场景。假设我们有某股票过去30天的每日涨跌幅数据：

# 示例数据：每日收益率百分比 daily_returns = [1.2, -0.5, 0.8, -1.5, 2.1, -0.3, 0.6, -0.7, 1.5, -1.2, 0.4, -0.9, 1.8, -0.2, 0.3, -0.6, 1.1, -1.8, 0.9, -0.4, 1.5, -0.8, 0.7, -1.1, 2.0, -0.5, 0.6, -0.9, 1.3, -0.7] # 定义状态阈值 BULL_THRESHOLD = 0.5 # 涨幅>0.5%为牛市 BEAR_THRESHOLD = -0.5 # 跌幅>0.5%为熊市

首先统计状态转移次数：

from collections import defaultdict transitions = defaultdict(int) state_sequence = [] for ret in daily_returns: if ret > BULL_THRESHOLD: state = 'Bull' elif ret < BEAR_THRESHOLD: state = 'Bear' else: state = 'Sideways' state_sequence.append(state) for i in range(len(state_sequence)-1): from_state = state_sequence[i] to_state = state_sequence[i+1] transitions[(from_state, to_state)] += 1

然后计算转移概率矩阵：

states = ['Bull', 'Bear', 'Sideways'] transition_counts = np.zeros((3, 3)) for i, from_state in enumerate(states): for j, to_state in enumerate(states): transition_counts[i,j] = transitions.get((from_state, to_state), 0) # 归一化 row_sum = np.sum(transition_counts[i]) if row_sum > 0: transition_counts[i] /= row_sum print("经验转移矩阵:\n", transition_counts)

5. 模型优化与扩展

基础模型有几个可以改进的方向：

状态划分优化

使用K-means聚类自动确定最佳状态阈值
增加状态数量（如"大幅上涨"、"小幅上涨"等）
考虑加入成交量等额外维度

预测精度提升

使用高阶马尔可夫链（考虑前n个状态）
结合隐马尔可夫模型处理未观测变量
集成机器学习方法进行状态分类

以下是一个使用滑动窗口预测的改进示例：

def predict_next_states(state_seq, transition_mat, window_size=3): """使用最近window_size个状态进行预测""" recent_states = state_seq[-window_size:] prob = np.ones(3) / 3 # 初始均匀分布 for state in recent_states: prob = np.dot(prob, transition_mat) return prob # 示例使用 current_sequence = ['Bull', 'Bull', 'Sideways'] print("预测概率:", predict_next_states(current_sequence, transition_counts))

马尔可夫链虽然假设简单，但在金融预测中展现了惊人的实用性。我在实际项目中发现，将其与简单的技术指标结合，能显著提高短期预测准确率。特别是在趋势明显的市场中，状态转移矩阵能有效捕捉市场的"惯性"特征。

查看全文

http://www.cnnetsun.cn/news/2608398.html