当前位置：首页 > news >正文

深度解析Spreadsheets-are-all-you-need：用电子表格重新定义AI模型探索

news 2026/6/6 19:28:59

深度解析Spreadsheets-are-all-you-need：用电子表格重新定义AI模型探索

【免费下载链接】spreadsheets-are-all-you-need项目地址: https://gitcode.com/GitHub_Trending/sp/spreadsheets-are-all-you-need

Spreadsheets-are-all-you-need是一个革命性的开源项目，它通过电子表格实现了GPT-2模型的完整前向传播，让非开发者也能直观探索Transformer架构的工作原理。这个项目巧妙地将复杂的AI模型拆解为可交互的电子表格单元格，为技术爱好者和教育工作者提供了前所未有的模型可视化工具。

架构设计：电子表格中的神经网络

核心实现原理

Spreadsheets-are-all-you-need的核心创新在于将GPT-2模型的每个计算层映射到Excel的标准函数中。项目通过精心设计的命名函数实现了神经网络的关键组件：

=gelu(x) # GELU激活函数实现 =layer_norm(range) # 层归一化 =softmax(range) # Softmax概率分布 =cosine_similarity(range1, range2) # 余弦相似度计算

技术要点：所有函数仅使用Excel内置的数学和统计函数，无需VBA或宏，确保跨平台兼容性和安全性。

模型组件分解

项目将GPT-2的Transformer架构分解为多个可管理的电子表格标签页：

嵌入层处理：将输入文本转换为向量表示
注意力机制：实现多头自注意力计算
前馈网络：通过GELU激活函数处理特征
输出层：生成概率分布并采样下一个token

每个组件都对应电子表格中的一个独立区域，通过单元格引用形成完整的数据流管道。

实战应用：从理论到实践

数据流可视化

Spreadsheets-are-all-you-need Notebooks扩展了这一概念，创建了基于浏览器的交互式数据分析环境。通过<saayn-table>和<saayn-code>标签，用户可以在单一HTML文件中构建完整的数据分析工作流：

<saayn-step description="产品订单分析"> <saayn-table id="product_orders"> <script type="text/csv"> Order ID,Product Name,Quantity,Price,Total "123456","Wireless Headphones",2,89.99,179.98 </script> </saayn-table> </saayn-step>

自定义函数开发

项目的核心在于可扩展的函数库。开发者可以通过创建自定义的Excel命名函数来扩展模型功能：

`bpe_get_score_for_pair` - 语法：`bpe_get_score_for_pair(left_char, right_char)` - 功能：从BPE词汇表中获取字符对的评分 - 实现：使用FILTER和IFERROR函数处理边界情况 `get_non_blanks_in_range` - 语法：`get_non_blanks_in_range(range)` - 功能：移除范围内的空白单元格 - 实现：利用FILTER函数的高效数组处理

技术深度：模型实现的精妙之处

BPE分词算法实现

Spreadsheets-are-all-you-need完整实现了Byte Pair Encoding（BPE）分词算法，这是GPT-2处理文本输入的关键步骤：

`Split_Into_Characters` - 语法：`Split_Into_Characters(word)` - 功能：将单词拆分为字符数组 - 实现：使用MID和SEQUENCE函数的组合 `token_for_token_id` - 语法：`token_for_token_id(token_id)` - 功能：根据token_id查找对应的token - 实现：通过VLOOKUP实现快速查找