当前位置：首页 > news >正文

金融虚假信息检测中LLM行为偏差与MFMD-Scen基准研究

news 2026/7/2 17:34:37

1. 金融虚假信息检测中的LLM行为偏差研究概述

在金融信息爆炸式增长的今天，大型语言模型(LLM)正被广泛应用于投资分析、风险预警和决策支持等关键领域。然而，这些模型的训练数据主要来源于人类编写的语料库，不可避免地会继承各种人类认知偏差。当这些"隐形乘客"潜入金融决策系统时，可能导致系统性误判——特别是在处理多语言金融虚假信息(Multilingual Financial Misinformation, MFMD)这类高风险任务时。

传统LLM偏差研究存在两个明显局限：一是评估方式过于简单，多采用直接提问的静态测试；二是场景设置单一，未能反映真实金融环境的复杂性。这就像在平静的实验室测试船只的抗风浪能力，而忽视了实际海洋中的暗流和风暴。MFMD-Scen基准的建立，正是为了填补这一空白。

2. MFMD-Scen基准的设计架构

2.1 三大核心场景构建

基准设计团队与金融领域专家合作，构建了三类具有代表性的金融场景：

2.1.1 角色-人格场景(MFMD-persona)将三类金融决策主体（散户投资者、专业机构、企业主）与五种典型行为金融偏差配对：

过度自信：典型表现为高估预测准确性（如"我昨天刚获利，这个投资建议肯定靠谱"）
损失厌恶：对损失的敏感度是同等收益的2倍（实验显示放弃$100损失的痛苦需要$200收益才能平衡）
从众行为：独立判断能力丧失（如"既然大家都在买这只股票..."）
锚定效应：过度依赖初始信息（如"专家说目标价是50元，现在30元肯定被低估了"）
确认偏误：选择性相信支持已有观点的信息

每种组合又分为显性（直接陈述偏差）和隐性（通过叙事线索暗示）两种呈现方式。例如对散户的过度自信场景，显性版本会明确说"作为过度自信的投资者"，而隐性版本则通过"我最近连续选对三只牛股"等语句暗示。

2.1.2 区域-市场场景(MFMD-region)覆盖六大经济区域：

欧美成熟市场（侧重机构主导、严格监管）
亚洲新兴市场（散户占比高、波动剧烈）
中东特色市场（宗教影响显著）
中国内地市场（政策导向性强）
澳大利亚市场（资源型经济）
亚太混合市场

每个区域场景都植入了当地特有的金融文化元素。例如在中东场景中会强调伊斯兰金融禁止利息的规定，而在中国场景中则会体现政策市特征。

2.1.3 身份-信仰场景(MFMD-identity)组合了12种族裔与4种宗教信仰：

族裔：华裔、印度裔、阿拉伯裔等
信仰：基督教、伊斯兰教、佛教、犹太教
特别注意避免了敏感组合（如欧洲穆斯林、阿拉伯基督徒）

这类场景揭示了模型如何在不同文化滤镜下解读同一金融主张。例如"利息收入"在伊斯兰金融背景下可能被标记为可疑，而在传统银行体系中则是正常表述。

2.2 多语言数据集构建

研究团队从Snopes平台筛选出502条金融领域声明，经专家标注后保留144条具有全球相关性的项目（其中虚假信息121条，真实信息23条）。通过GPT-4.1辅助翻译加人工校验的方式，构建了包含英语、中文、希腊语和孟加拉语的平行语料库。

翻译质量控制采用双盲校验：

初译由GPT-4.1完成
母语者评估翻译质量
专业译者修正问题语句
另一评审二次验证

最终各语言版本的标注者间一致性系数（Kappa）均高于0.7，中文版本甚至达到完美1.0（虽然发现4处明显错误，但错误非常明显导致标注者一致误判）。

3. 22个主流LLM的评估发现

3.1 总体表现特征

评估涵盖22个主流模型，包括：

商业模型：GPT-4.1/5-mini、Claude系列、Gemini系列
开源模型：DeepSeek、Qwen、Llama、Mistral等各尺寸版本

关键发现：

真假判断能力不对称：所有模型识别虚假声明的F1值均高于0.85，但判断真实声明的能力显著较弱。这好比"宁可错杀一百"的保守策略，反映模型对误报(false positive)的容忍度高于漏报(false negative)。
规模效应明显：参数量超过700亿的模型（如GPT-4.1、Claude-Sonnet）表现更稳定，小模型（如Mistral-7B）偏差幅度平均高出40%。
推理链(Chain-of-Thought)并非万能：仅在大型模型上持续有效，对小模型反而可能增加混乱——特别是在低资源语言（孟加拉语）中，推理步骤常包含幻觉性内容。