微软在 Hugging Face 开源的 Harrier-OSS v1 家族,具备270M、0.6B 和 27B 三档模型支持,采用 decoder-only 架构、L2 归一化和 last-token pooling,最长支持 32768 token,广泛应用于检索、聚类、语义相似度、分类和双语挖掘。
Multilingual MTEB v2 是一种业界标准基准,常用于多语言文本嵌入任务,测试检索、分类和语义相似度等能力。Harrier-OSS 的版本在最新测试中取得了 66.5、69.0 和 74.3 分数,27B 版在发布时登上榜首。三款版本均采用 MIT 许可,支持深度知识蒸馏。这些模型在开源社区中树立了良好的口碑。
原创文章,作者:admin,如若转载,请注明出处:https://www.23btc.com/164749/


