OpenRouter 近日推出了名为 Fusion 的复合模型接口,该接口能够将用户输入的提示词并行分发给多个大语言模型,再通过裁判模型与合成模型输出最终解答。在 Perplexity AI 发布的 DRACO 深度研究基准测试中,基于 Fusion 的多种模型组合展现出对传统单模型的明显压制力。
正文解读
根据测试数据,将 Fable 5 与 GPT-5.5 构建成面板,再经 Opus 4.8 合成后取得了 69.0% 的最高分,显著超越 Fable 5 单模型运行的 65.3% 成绩。研究还发现,即使是同一模型进行“左右互搏”也有明显增幅,Opus 4.8 与自身组成双面板进行自我合成后,得分从单独运行时的 58.8% 提升至 65.5%。
对于追求高性价比的用户,由 Gemini 3 Flash、Kimi K2.6 与 DeepSeek V4 Pro 组成的低成本面板同样在合成下取得了 64.7% 的分数,在调用成本减半的情况下,与 Fable 5 的差距缩小至 0.6 个百分点。这一结果表明,不同厂商模型的训练差异和逻辑多样性在复杂任务中能够带来更丰富的视角互补。
该基准测试涵盖 10 个维度共 100 项复杂研究任务。为防止模型在检索过程中意外访问在线评测标准导致得分失真,OpenRouter 在服务端配置了过滤检索域名列表。目前 Fusion 接口已对 API 用户开放,默认标识符为 openrouter/fusion,用户也可以在网页端自定义参与合成的模型面板。
随着多模型协同方案的逐步成熟,Fusion 为开发者提供了灵活的性能与成本平衡选项,但实际部署中仍需注意接口调用延迟以及不同模型间的协调成本。未来这一模式或将在更多复杂推理任务中替代单一模型方案。
原创文章,作者:admin,如若转载,请注明出处:https://www.23btc.com/189712/



