当前位置：首页 > news >正文

知识追踪驱动的自适应学习系统：基于贝叶斯网络的算法训练

news 2026/6/10 8:01:12

知识追踪驱动的自适应学习系统：基于贝叶斯网络的算法训练

一、刷题的"一刀切"困境：为什么统一题单效率低下？

大多数刷题平台采用"题单"模式——按难度或标签分组，用户按顺序做题。问题在于：每个人的知识薄弱点不同，一个已经掌握二分查找的人还在做二分入门题，纯粹浪费时间；而一个动态规划薄弱的人被推了 Hard 级别的树形 DP，只会挫败信心。题单模式本质上是"一刀切"——不考虑个体差异，不追踪知识掌握状态。

自适应学习系统的核心是"知识追踪"——建模每个用户对每个知识点的掌握程度，根据掌握状态动态调整出题策略。掌握程度高的知识点减少练习，掌握程度低的知识点加强训练，实现"千人千面"的学习路径。

二、知识追踪与自适应出题架构

graph TB subgraph 知识追踪 A[用户答题记录] --> B[贝叶斯知识追踪 BKT] B --> C[掌握概率 P<br/>每个知识点一个概率值] end subgraph 自适应出题 C --> D[难度适配<br/>P>0.9 跳过<br/>0.5<P<0.9 巩固<br/>P<0.5 补基础] D --> E[知识点选择<br/>优先最薄弱的前置知识] E --> F[题目推荐<br/>匹配难度和知识点] end subgraph 反馈闭环 F --> G[用户答题] G --> A B --> H[学习曲线可视化] end

贝叶斯知识追踪（BKT）为每个知识点维护四个参数：P(L₀) 初始掌握概率、P(T) 学习转移概率（未掌握→掌握）、P(G) 猜对概率、P(S) 失误概率。每次答题后，根据答题结果更新掌握概率 P(Lₜ)。

三、系统实现

3.1 贝叶斯知识追踪

from dataclasses import dataclass from typing import Dict, List @dataclass class BKTParams: """BKT 模型参数""" p_l0: float = 0.1 # 初始掌握概率 p_t: float = 0.1 # 学习转移概率（未掌握→掌握） p_g: float = 0.2 # 猜对概率（未掌握时答对的概率） p_s: float = 0.1 # 失误概率（掌握时答错的概率） class BayesianKnowledgeTracing: """贝叶斯知识追踪：建模知识掌握状态""" def __init__(self): # 每个知识点的 BKT 参数 self.params: Dict[str, BKTParams] = {} # 每个用户在每个知识点的当前掌握概率 self.mastery: Dict[str, Dict[str, float]] = {} def register_knowledge( self, name: str, params: BKTParams = None ) -> None: """注册知识点""" self.params[name] = params or BKTParams() def update( self, user_id: str, knowledge: str, correct: bool ) -> float: """ 根据答题结果更新掌握概率。 返回更新后的掌握概率。 """ params = self.params.get(knowledge) if not params: return 0.0 # 获取当前掌握概率 if user_id not in self.mastery: self.mastery[user_id] = {} p_l = self.mastery[user_id].get( knowledge, params.p_l0 ) # 贝叶斯更新 if correct: # P(L_t | 答对) = P(答对|掌握) * P(掌握) / P(答对) p_correct_given_mastery = 1 - params.p_s p_correct_given_no_mastery = params.p_g p_correct = (p_correct_given_mastery * p_l + p_correct_given_no_mastery * (1 - p_l)) p_l_given_correct = ( p_correct_given_mastery * p_l / p_correct ) else: # P(L_t | 答错) = P(答错|掌握) * P(掌握) / P(答错) p_wrong_given_mastery = params.p_s p_wrong_given_no_mastery = 1 - params.p_g p_wrong = (p_wrong_given_mastery * p_l + p_wrong_given_no_mastery * (1 - p_l)) p_l_given_wrong = ( p_wrong_given_mastery * p_l / p_wrong ) # 考虑学习转移：即使当前未掌握，答题后也可能掌握 p_l_new = p_l_given_correct if correct else p_l_given_wrong p_l_new = p_l_new + (1 - p_l_new) * params.p_t # 限制在 [0, 1] 范围内 p_l_new = max(0.0, min(1.0, p_l_new)) self.mastery[user_id][knowledge] = p_l_new return p_l_new def get_mastery( self, user_id: str, knowledge: str ) -> float: """获取当前掌握概率""" if user_id not in self.mastery: return self.params.get( knowledge, BKTParams() ).p_l0 return self.mastery[user_id].get( knowledge, self.params.get(knowledge, BKTParams()).p_l0 )

3.2 自适应出题策略

from enum import Enum class DifficultyLevel(Enum): SKIP = "skip" # P > 0.9，跳过 CONSOLIDATE = "consolidate" # 0.5 < P < 0.9，巩固 FOUNDATION = "foundation" # P < 0.5，补基础 class AdaptiveScheduler: """自适应出题调度器""" # 知识点依赖关系 PREREQUISITES = { "动态规划": ["递归", "数组"], "背包问题": ["动态规划"], "子序列问题": ["动态规划"], "图论": ["DFS/BFS"], "最短路径": ["图论", "动态规划"], "拓扑排序": ["图论"], "二叉树": ["递归"], "平衡树": ["二叉树"], } def __init__(self, bkt: BayesianKnowledgeTracing): self.bkt = bkt def recommend( self, user_id: str, available_problems: List[dict] ) -> List[dict]: """推荐题目列表""" # 1. 计算每个知识点的掌握状态和推荐难度 knowledge_status = {} for k_name in self.bkt.params: p = self.bkt.get_mastery(user_id, k_name) level = self._classify(p) knowledge_status[k_name] = { 'mastery': p, 'level': level, } # 2. 优先推荐最薄弱的前置知识 weak_knowledges = self._get_weak_prerequisites( user_id, knowledge_status ) # 3. 匹配题目 recommendations = [] for k_name in weak_knowledges: status = knowledge_status[k_name] target_difficulty = self._target_difficulty( status['level'] ) matched = self._match_problems( available_problems, k_name, target_difficulty ) recommendations.extend(matched[:2]) # 每个知识点最多2题 return recommendations[:5] # 每次推荐5题 def _classify(self, p: float) -> DifficultyLevel: """根据掌握概率分类""" if p > 0.9: return DifficultyLevel.SKIP elif p > 0.5: return DifficultyLevel.CONSOLIDATE else: return DifficultyLevel.FOUNDATION def _get_weak_prerequisites( self, user_id: str, status: dict ) -> List[str]: """获取最薄弱的前置知识点（优先补基础）""" weak = [] for k_name, s in status.items(): if s['level'] == DifficultyLevel.FOUNDATION: # 检查前置知识是否更薄弱 prereqs = self.PREREQUISITES.get(k_name, []) has_weaker_prereq = any( status.get(p, {}).get('mastery', 1.0) < s['mastery'] for p in prereqs ) if not has_weaker_prereq: weak.append(k_name) # 按掌握概率升序排列 weak.sort(key=lambda k: status[k]['mastery']) return weak def _target_difficulty(self, level: DifficultyLevel) -> str: """映射推荐难度""" mapping = { DifficultyLevel.FOUNDATION: "Easy", DifficultyLevel.CONSOLIDATE: "Medium", DifficultyLevel.SKIP: "Hard", } return mapping[level] def _match_problems( self, problems: List[dict], knowledge: str, difficulty: str ) -> List[dict]: """匹配知识点和难度的题目""" return [ p for p in problems if knowledge in p.get('tags', []) and p.get('difficulty') == difficulty ]