当前位置：首页 > news >正文

QMutBench：量子软件测试的基准数据集构建与应用实战

news 2026/6/22 12:14:44

1. 项目概述：量子软件测试的“标尺”与“考题”

如果你正在开发或研究量子软件，无论是编译器、模拟器还是错误缓解工具，一个绕不开的核心问题就是：我怎么知道我的工具到底好不好用？它的优化效果提升了多少？它对噪声的鲁棒性到底怎么样？传统的做法可能是自己设计几个简单的测试电路，或者跑几个公开的基准测试套件。但这里存在一个根本性的挑战：缺乏一个系统化、可量化、且贴近真实缺陷场景的评估基准。这就好比给学生出考题，如果题目总是那几道，学生很快就能“刷题”刷出高分，但这并不能真实反映其解决新问题的能力。

QMutBench 的出现，正是为了解决这个痛点。它不是一个单一的量子程序，而是一个专门为量子软件测试与评估构建的量子电路突变体数据集。你可以把它理解为一套为量子软件量身定制的、系统化的“考题库”和“错误样本库”。它的核心价值在于，通过向原始（正确的）量子电路中注入特定类型的、可控的“缺陷”（即突变体），来模拟量子软件在开发或运行过程中可能遇到的各种真实错误。然后，测试者可以运行自己的量子软件工具（我们称之为“测试对象”，如编译器、测试工具、验证工具等）去处理这些包含了已知“缺陷”的电路，通过检查工具能否正确识别、定位、容忍或修复这些缺陷，来客观、量化地评估该工具的各项性能指标，例如缺陷检测率、优化保真度、资源消耗变化等。

简单来说，QMutBench 为混沌初开的量子软件测试领域，提供了一把急需的“标尺”和一套丰富的“考题”。它使得不同团队开发的工具能够在同一个基准、同一种“语言”下进行公平比较，极大地推动了量子软件工程向着更严谨、更可重复、更工业化的方向发展。对于量子计算的研究人员、工具开发者乃至最终用户，理解和使用这样的数据集，正变得越来越重要。

2. QMutBench 的核心设计思路与价值解析

2.1 从经典软件测试到量子软件测试的范式迁移

要理解 QMutBench 的价值，最好从经典的软件测试说起。在经典计算中，突变测试（Mutation Testing）是一种成熟的、用于评估测试用例充分性的技术。其基本思想是：人为地在源代码中制造一些小的、语法正确的改动（即创建“突变体”），然后看现有的测试用例能否检测出这些改动（即“杀死”突变体）。如果测试用例能杀死大部分突变体，说明它的缺陷检测能力很强；反之，则说明测试覆盖不足。

QMutBench 将这一经典思想创造性地迁移到了量子计算领域。但量子电路与传统软件代码有本质不同：它是描述量子比特上一系列幺正变换的指令序列，其“缺陷”形态和影响机制更为复杂。一个量子电路中的错误，可能来源于算法设计失误、编译器优化引入的偏差、硬件门操作的不精确，甚至是量子比特间的串扰。因此，QMutBench 在设计突变体时，必须深入量子计算的底层语义。

它的核心思路是：选取一批具有代表性的、正确的量子电路作为“种子”（Seed Circuits）。这些种子电路可能来自量子算法库（如Qiskit、Cirq中的示例）、基准测试套件（如QUEKO、SupermarQ）或实际应用案例。然后，对这些种子电路应用一系列预定义的“突变操作符”（Mutation Operators），从而系统地生成大量包含特定类型缺陷的电路变体，即突变体。

2.2 突变操作符：定义量子世界的“典型错误”

突变操作符是 QMutBench 的“灵魂”，它定义了我们会注入哪些类型的错误。一个设计良好的操作符集合应该能够模拟真实量子软件开发流程中多个阶段可能出现的典型问题。通常，这些操作符可以分为几个层次：

算法/逻辑层突变：模拟算法设计或编程错误。例如：
- 门替换：将CNOT门替换为CZ门，或者将RX(pi/2)替换为RY(pi/2)。这模拟了开发者对量子门功能理解偏差或代码编写错误。
- 参数扰动：改变旋转门的旋转角度，例如RZ(theta)变为RZ(theta + delta)。这模拟了参数计算错误或输入错误。
- 门序列调整：删除一个门、重复插入一个门，或者交换两个相邻但不可交换的门（如H和CNOT的控制位）的顺序。这模拟了控制流逻辑错误。
编译/映射层突变：模拟量子编译器在将逻辑电路适配到具体硬件拓扑结构时引入的问题。例如：
- 路由插入：在需要交互但物理上不相邻的量子比特之间，插入额外的SWAP门链来实现连接。这模拟了编译器路由算法的结果，可以用来测试工具是否能识别出这些“开销”门并进行优化。
- 基础门集转换错误：将T门分解为S和T门的序列时，错误地使用了分解方案。这模拟了编译器在面向特定硬件原生门集进行转换时可能产生的错误。
噪声/物理层突变（高级特性）：一些更先进的突变体数据集可能会尝试模拟近期的噪声特征。例如，插入一些代表特定噪声信道的量子门（如幅度阻尼信道、去极化信道），或者模拟串扰（在目标比特上操作时，对其相邻比特施加一个微小的旋转）。这用于测试错误缓解工具或噪声感知编译器的有效性。

QMutBench 通过组合这些操作符，并应用于不同规模和复杂度的种子电路，能够生成一个覆盖多维度错误模式的突变体数据集。每个突变体都带有“元数据”标签，明确记录了它是由哪个种子电路、通过哪个操作符、在哪个位置生成的。这为后续的评估提供了“标准答案”。

2.3 数据集的价值：超越简单的对错判断

拥有这样一个数据集，其价值远不止于判断一个工具“能否发现错误”。它使得一系列精细化的量化评估成为可能：

测试工具评估：一个量子电路测试工具可以尝试运行在突变体上，看它能检测出多少。计算突变得分：（被杀死的突变体数量 / 总突变体数量）。得分越高，工具越有效。
编译器优化评估：比较原始电路和突变体电路经过编译器优化后，在模拟或真实硬件上运行的保真度差异。一个稳健的编译器应该对某些类型的突变（如多余的SWAP）有优化能力，而对另一些突变（如改变算法逻辑）应保持原样或报错。可以评估优化过程是否意外“掩盖”了缺陷（这是危险的）。
错误缓解技术评估：在注入噪声层突变的电路上，应用不同的错误缓解策略（如零噪声外推、测量误差缓解），比较其恢复原始计算结果的能力。
基准测试标准化：不同研究论文可以统一使用 QMutBench 作为评估基准，其结果具有直接可比性，避免了“自说自话”、使用私有测试用例导致结果无法复现和比较的问题。

3. 深入拆解：QMutBench 数据集的结构与使用范式

3.1 典型数据集结构剖析

一个完整的 QMutBench 类数据集通常不是一堆杂乱的电路文件。它遵循一种精心设计的结构，以方便用户程序化地访问和使用。以下是一个概念性的目录结构示例：

QMutBench/ ├── seeds/ # 种子电路目录 │ ├── algorithm/ # 算法电路，如 Grover, QAOA, VQE ansatz │ ├── benchmark/ # 标准基准电路，如 QFT, Adder, Random │ └── real_world/ # 简化版的实际应用电路 ├── mutation_operators.yaml # 突变操作符的定义文件 ├── mutants/ # 生成的突变体电路 │ ├── seed_001/ # 对应第一个种子电路 │ │ ├── operator_A/ # 应用操作符A生成的所有突变体 │ │ │ ├── mutant_001.qasm │ │ │ ├── mutant_002.qasm │ │ │ └── metadata.json # 记录突变位置、类型等信息 │ │ └── operator_B/ │ └── seed_002/ └── evaluation_scripts/ # 提供的评估脚本示例 ├── run_mutation_test.py └── calculate_score.py

关键文件说明：

种子电路：通常以.qasm(OpenQASM) 或主流框架（Qiskit、Cirq）的序列化格式存储。它们确保是功能正确且经过验证的。

突变操作符定义文件：这是一个核心配置文件，可能用 YAML 或 JSON 编写。它明确定义了每个操作符的标识符、描述、以及应用于电路的函数或规则。例如：

operators: - id: "gate_replacement_cnot_to_cz" name: "CNOT to CZ Replacement" description: "Replace a randomly selected CNOT gate with a CZ gate." layer: "logical" - id: "parameter_shift_rx" name: "RX Parameter Shift" description: "Add a small epsilon (e.g., 0.1) to the angle of a randomly selected RX gate." layer: "logical" - id: "insert_swap_chain" name: "Insert SWAP Chain" description: "Insert a SWAP gate chain between two non-adjacent qubits that require interaction." layer: "compilation"

突变体电路与元数据：每个突变体电路文件本身。旁边的metadata.json至关重要，它可能包含：
```
{ "seed_id": "grover_2qubits", "mutant_id": "grover_2qubits_opA_001", "operator_applied": "gate_replacement_cnot_to_cz", "application_point": {"gate_index": 5, "qubits": [0, 1]}, "original_gate": "cx", "mutated_to": "cz" }
```
这份“出生证明”让评估工具能精确知道哪里被改了、改成了什么，这是计算评估指标的基础。

3.2 使用工作流：以评估一个量子电路测试工具为例

假设你开发了一个静态分析工具，声称能检测量子电路中的潜在 bug。如何使用 QMutBench 来评估它？

步骤 1：获取与加载数据集首先，从项目仓库（如 GitHub）下载 QMutBench 数据集。然后，编写一个简单的加载器，读取种子电路和对应的突变体电路及其元数据。

import json from qiskit import QuantumCircuit def load_mutant(mutant_path): """加载突变体电路及其元数据。""" qasm_path = mutant_path + '.qasm' meta_path = mutant_path + '_meta.json' circuit = QuantumCircuit.from_qasm_file(qasm_path) with open(meta_path, 'r') as f: metadata = json.load(f) return circuit, metadata # 示例：遍历所有突变体 base_dir = './QMutBench/mutants/' for seed_dir in os.listdir(base_dir): for op_dir in os.listdir(os.path.join(base_dir, seed_dir)): for mutant_file in os.listdir(os.path.join(base_dir, seed_dir, op_dir)): if mutant_file.endswith('.qasm'): mutant_id = mutant_file[:-5] circuit, meta = load_mutant(os.path.join(base_dir, seed_dir, op_dir, mutant_id)) # ... 后续处理

步骤 2：运行被测工具将每个突变体电路输入你的测试工具。工具会输出一个分析结果，例如{“is_defective”: True/False, “confidence”: 0.95, “location”: [gate_index]}。

步骤 3：结果判定与分数计算将工具的预测结果与元数据中的“标准答案”进行比对。判定规则通常如下：

真阳性 (TP)：工具报告有缺陷，且该缺陷确实存在于突变体元数据标注的位置（或同类型）。
假阳性 (FP)：工具报告有缺陷，但该电路位置并无元数据标注的注入缺陷（注意：种子电路本身可能也有工具认为的“坏味道”，这需要仔细定义）。
假阴性 (FN)：工具报告无缺陷，但元数据表明该电路存在注入的缺陷。
真阴性 (TN)：工具报告无缺陷，且电路确实无注入缺陷（即对原始种子电路的判断，但通常更关注突变体）。

基于此，可以计算一系列指标：

突变得分 (Mutation Score)：(TP) / (TP + FN)。这是最核心的指标，直接衡量工具检测注入缺陷的能力。
精确率 (Precision)：TP / (TP + FP)。衡量工具报警的准确率，避免误报过多。
召回率 (Recall)：等同于突变得分。
F1-Score：精确率和召回率的调和平均数。

步骤 4：分层分析与洞察不要只满足于一个总分。进一步分层分析：

按操作符分析：你的工具对“门替换”类缺陷检测率很高，但对“参数扰动”类不敏感？这指明了工具的改进方向。
按电路规模分析：随着量子比特数增加，工具的检测性能是否急剧下降？这反映了工具的可扩展性。
与基线工具对比：在同一个 QMutBench 上运行你的工具和已有的经典工具（如 QCOR、QuSAT），可以直观展示性能提升。

实操心得：在计算得分时，务必注意“等价突变体”问题。有些突变操作可能实际上并未改变电路的逻辑功能（例如，在某些特定上下文中，H门重复两次等于恒等操作）。这些突变体是无法被“杀死”的，在计算总分时应将它们从分母中剔除，否则会不公平地拉低分数。识别等价突变体本身就是一个研究课题，通常需要通过形式验证或模拟来判定。

4. 构建与扩展：如何打造自己的领域特定突变体数据集

QMutBench 提供了一个通用框架，但你可能需要针对特定领域（如量子化学模拟、量子机器学习）构建专属的数据集。以下是关键步骤和注意事项。

4.1 种子电路的选择策略

种子电路的质量决定了数据集的代表性和实用性。

多样性：应覆盖不同算法类型（搜索、优化、模拟）、不同电路宽度（比特数）和深度、不同门集（Clifford, T, 含参旋转门）。
来源：
- 标准算法库：Qiskit, Cirq, PennyLane 中的教程和示例电路。
- 基准测试套件：从 QUEKO, SupermarQ, QASMBench 中选取。
- 真实应用原型：与领域专家合作，获取简化但具有代表性的化学、材料或机器学习电路。
规模控制：初期可以从中小规模电路（如 5-20 量子比特，深度 50-200）开始，确保后续突变生成和模拟验证在计算上可行。

4.2 设计定制化的突变操作符

这是体现数据集专业性的关键。你需要深入分析目标领域软件常见的错误模式。

针对量子化学 VQE：
- Ansatz 结构错误：错误地交换了Entangling层和Rotation层的顺序。
- 参数共享错误：本应独立的参数被错误地绑定为同一个。
- 映射错误：将分子轨道的映射关系弄错，导致哈密顿量不对应。
针对量子机器学习：
- 数据编码错误：经典数据到量子态编码方案（如振幅编码、角度编码）的实现错误。
- 测量方式错误：误用了期望值测量和投影测量。
针对特定硬件编译器：
- 原生门分解错误：不符合硬件校准规范的门分解方式。
- 脉冲级调度冲突：模拟因脉冲重叠导致的串扰错误。

定义操作符时，需要精确实现其代码，确保生成的突变体在语法上是合法的（能被解析器接受），但语义上是“有缺陷的”。

4.3 突变体生成与验证流程

这是一个自动化流水线：

解析种子电路：将电路加载为内部表示（如 DAG）。
应用操作符：遍历电路的合适位置（如所有单/双门），根据操作符规则进行修改。可能需要随机采样位置以确保多样性。
序列化输出：将突变后的电路保存为标准格式（如 OpenQASM 2.0/3.0），并同步生成详细的元数据文件。
等价性检查（可选但重要）：对每个突变体，使用量子电路模拟器（带或不带噪声）计算其输出分布（或最终态）与原始种子的差异。如果差异在某个阈值以下（例如，保真度 > 0.999），则可能是一个“等价突变体”，需要打上标签，或在评估时特殊处理。

# 伪代码：突变体生成核心逻辑 import numpy as np from qiskit import QuantumCircuit, transpile from qiskit.quantum_info import Statevector def generate_mutants(seed_circuit, operator_list, num_mutants_per_op=10): """为单个种子电路生成突变体。""" mutants = [] for op in operator_list: for _ in range(num_mutants_per_op): # 深拷贝种子电路，避免污染 mutant_circ = seed_circuit.copy() # 在合法位置中随机选择一个应用点 candidate_positions = find_application_points(mutant_circ, op) if not candidate_positions: continue pos = np.random.choice(candidate_positions) # 应用突变操作 apply_operator(mutant_circ, op, pos) # 验证语法（通过 transpile 或直接保存） try: # 尝试转换以验证合法性 transpiled = transpile(mutant_circ, basis_gates=['u3', 'cx']) except Exception as e: print(f"Operator {op['id']} generated invalid circuit: {e}") continue # 生成元数据 metadata = { 'seed_id': seed_circuit.name, 'operator': op['id'], 'position': pos, # ... 其他信息 } mutants.append((mutant_circ, metadata)) return mutants

4.4 质量保证与版本管理

可复现性：为整个生成流程设置随机种子，确保每次运行都能生成完全相同的突变体集合。
完整性检查：确保每个突变体电路文件都能被主流量子框架成功加载和执行。
文档：详细记录每个操作符的语义、每个种子电路的来源和特征。
版本控制：使用 Git 管理数据集，清晰的提交信息说明每次增加了什么电路或操作符。

注意事项：突变体数据集的规模可能爆炸式增长（种子数 × 操作符数 × 每操作符突变体数）。务必设计好存储结构，并考虑提供按需生成脚本，而不是分发一个巨大的静态文件包。同时，公开数据集时应遵循良好的数据许可协议（如 MIT, Apache 2.0）。

5. 实战评估案例：利用 QMutBench 评测量子编译器优化能力

让我们通过一个具体的模拟案例，展示如何使用 QMutBench 来评估一个量子编译器的优化通过（Optimization Pass）是否可靠。

评估目标：评测一个自定义的“移除冗余门”优化通过。该通过旨在识别并删除电路中无用的门（如前后相邻的H门、X门）。

实验设计：

选取测试集：从 QMutBench 中选取包含大量单比特门序列的种子电路及其突变体。我们特别关注那些注入了“冗余门插入”突变的电路（例如，故意插入H-H或X-X序列）。
定义评估指标：
- 优化正确性：对于原始种子电路，优化不应改变其功能。通过计算优化前后电路输出状态的保真度（应接近1.0）来验证。
- 缺陷检测/保留能力：对于注入了冗余门的突变体，理想的优化器应该能移除这些冗余门，使电路恢复或接近原始种子电路的功能。我们可以计算优化后突变体与原始种子的保真度。保真度越高，说明优化器越有效地“修复”了这个特定缺陷。
- 误优化风险：对于其他类型缺陷的突变体（如CNOT被误换为CZ），优化器应该保持电路不变（或变化极小），因为这不是冗余门问题。如果优化器大幅改变了这类电路的功能，说明它可能错误地“优化”了本应保留的缺陷，这是危险的。计算优化前后突变体自身的保真度，应接近1.0。

实验步骤与代码片段：

import numpy as np from qiskit import QuantumCircuit, transpile from qiskit.quantum_info import Statevector, average_gate_fidelity from qiskit.transpiler import PassManager from my_custom_passes import RemoveRedundantGatesPass # 假设的自定义优化通过 def evaluate_optimization_pass(dataset_path): """评估自定义优化通过。""" results = [] # 1. 加载原始种子电路 seed_circuit = load_circuit(f"{dataset_path}/seeds/example.qasm") seed_state_before = Statevector.from_instruction(seed_circuit) # 2. 对原始种子应用优化 pm = PassManager(RemoveRedundantGatesPass()) optimized_seed = pm.run(seed_circuit) seed_state_after = Statevector.from_instruction(optimized_seed) # 计算原始电路优化保真度 fidelity_seed = seed_state_before.fidelity(seed_state_after) print(f"原始种子电路优化保真度: {fidelity_seed:.6f}") # 3. 遍历相关突变体 mutant_folder = f"{dataset_path}/mutants/example/redundant_gate_insertion/" for mutant_file in os.listdir(mutant_folder): if mutant_file.endswith('.qasm'): mutant_circuit = QuantumCircuit.from_qasm_file(os.path.join(mutant_folder, mutant_file)) # 加载对应元数据，获取原始种子信息 # ... (代码省略) # 计算突变体与原始种子的理想保真度（优化前） mutant_state = Statevector.from_instruction(mutant_circuit) ideal_fidelity_before = mutant_state.fidelity(seed_state_before) # 对突变体应用优化 optimized_mutant = pm.run(mutant_circuit) optimized_state = Statevector.from_instruction(optimized_mutant) # 计算优化后突变体与原始种子的保真度 ideal_fidelity_after = optimized_state.fidelity(seed_state_before) # 计算优化前后突变体自身的保真度（检查误优化） self_fidelity = mutant_state.fidelity(optimized_state) results.append({ 'mutant_id': mutant_file, 'ideal_fidelity_before': ideal_fidelity_before, 'ideal_fidelity_after': ideal_fidelity_after, 'self_fidelity': self_fidelity, 'gate_count_reduction': mutant_circuit.size() - optimized_mutant.size() }) # 4. 分析结果 analyze_results(results) def analyze_results(results): """分析评估结果。""" # 分类：对于冗余门插入突变体，理想保真度优化后应显著提升 redundant_mutants = [r for r in results if 'redundant' in r['mutant_id']] # 假设文件名包含类型 other_mutants = [r for r in results if 'redundant' not in r['mutant_id']] print("\n--- 对‘冗余门插入’突变体的优化效果 ---") avg_improvement = np.mean([r['ideal_fidelity_after'] - r['ideal_fidelity_before'] for r in redundant_mutants]) print(f"平均保真度提升: {avg_improvement:.4f}") print(f"平均门数减少: {np.mean([r['gate_count_reduction'] for r in redundant_mutants]):.1f}") print("\n--- 对其他类型突变体的影响 ---") # 我们希望 self_fidelity 接近1.0，说明优化没有破坏原有缺陷结构 avg_self_fidelity = np.mean([r['self_fidelity'] for r in other_mutants]) print(f"平均自身保真度（应接近1.0）: {avg_self_fidelity:.6f}") if avg_self_fidelity < 0.999: print("警告：优化通过可能错误地修改了非冗余缺陷电路！")

结果解读：

如果对于冗余门插入突变体，ideal_fidelity_after显著高于ideal_fidelity_before，且门数减少，说明优化通过有效。
如果对于其他突变体，self_fidelity始终非常接近 1.0，说明优化通过是安全的，没有引入误操作。
如果self_fidelity在某些非冗余突变体上显著低于1.0，就需要深入检查优化通过的逻辑：它是否过于激进，删除或改变了本应保留的、具有特殊功能的门序列？

通过这样系统化的评估，我们不仅能知道优化通过“有没有用”，更能精确地知道它“在什么情况下有用，在什么情况下可能有害”。这是 QMutBench 类数据集带来的深度评估能力。

6. 常见挑战、陷阱与未来方向

6.1 实践中的常见问题与排查

突变体爆炸问题：对于大型种子电路，可能的突变位置非常多，生成所有组合会导致数据集过大。
- 应对策略：采用抽样策略。例如，对每个操作符-种子对，随机生成固定数量（如100个）的突变体，并确保覆盖电路的不同区域（开头、中间、结尾）。记录随机种子以保证可复现性。
等价突变体判定难题：自动识别两个量子电路是否功能等价是量子计算中的一个难题（特别是对于含参电路）。
- 当前实践：对于无参 Clifford 电路，可以使用更高效的表模拟或稳定子形式进行精确等价性检查。对于通用电路，通常采用基于模拟的近似判定：在多个随机输入态下模拟两个电路，计算输出态的保真度，如果平均保真度高于一个阈值（如 0.999999），则认为是等价的。但这计算开销大，且存在误判风险。
- 建议：在数据集文档中明确列出被标记为“疑似等价”的突变体，并说明判定方法和阈值，让使用者知情并决定是否在评估中排除它们。

评估指标的选择与误解：

陷阱：只关注总体突变得分，忽略了对不同操作符、不同电路规模的细分分析。一个工具可能在检测简单门替换上得分很高，但对参数错误完全无效，总体得分却可能因为简单突变体多而被拉高。

正确做法：始终进行分层分析报告。提供如下的评估结果表格：

突变操作符类型	突变体总数	检测出数	突变得分	备注
单比特门替换	150	145	96.7%	工具对 Pauli 门替换敏感
双比特门替换	150	80	53.3%	对`CNOT`<->`CZ`替换不敏感
参数扰动 (	δ	<0.1)	100	10
冗余门插入	100	99	99.0%	表现优异
总计	500	334	66.8%

计算资源限制：对大规模突变体进行模拟验证或运行评估工具，需要大量计算资源。
- 建议：数据集提供者可以同时提供每个电路的基本特征（门数、深度、T门数等），帮助用户预先筛选适合其资源限制的子集进行评估。也可以考虑提供基于云端的评估服务或脚本。

6.2 QMutBench 的局限性与未来演进

当前的 QMutBench 及其类似数据集主要聚焦于数字量子电路的逻辑层和编译层错误。未来有几个重要的发展方向：

向噪声感知突变体扩展：定义更精细的突变操作符来模拟特定硬件噪声模型（如 IBM 的ibm_*噪声模型、Rigetti 的噪声特征）。例如，插入特定松弛时间的T1、T2错误信道，或模拟串扰效应的门。
涵盖混合量子经典算法：对于 VQE、QAOA 等算法，错误可能发生在经典优化循环与量子电路的交界处。需要定义新的突变体，如错误的目标函数计算、有问题的参数更新逻辑等。
集成到 CI/CD 流水线：未来，量子软件库的持续集成系统可以自动拉取最新的突变体数据集，对每次提交的代码变更运行测试，并报告突变得分的变化，从而实现量子软件的回归测试自动化。
社区驱动的开放数据集：建立一个平台，允许研究者和开发者提交新的种子电路、提议新的突变操作符，并共同维护一个不断增长、经过验证的基准数据集，使其成为量子软件测试领域的“ImageNet”。

QMutBench 及其所代表的方法论，正在为量子软件从“玩具代码”走向“工业级代码”铺设一条坚实的道路。它迫使开发者以更系统、更严谨的方式思考软件质量，最终将有助于交付更可靠、更高效的量子计算解决方案。对于每一位量子软件工程师和研究者来说，掌握如何利用、评估乃至贡献于这样的基准数据集，正逐渐成为一项必备的核心技能。

查看全文

http://www.cnnetsun.cn/news/2985107.html