当前人工智能模型在处理长序列任务时面临着根本性的计算瓶颈。无论是分析完整的法律文档、处理大型代码仓库,还是进行长篇对话,现有模型都受到transformer架构中注意力机制的限制——其计算复杂度随序列长度呈二次增长(o(n²...
没有更多内容