.@NVIDIA的Llama-Embed-Nemotron-8B刚刚在MMTEB多语言检索排行榜上夺得第一名——成为首个开放且可移植的嵌入模型。 它为检索、重新排序和语义相似性设定了新的标准,覆盖1000多种语言,超越了谷歌的GeminiEmbedding和阿里巴巴的Qwen3-8B。基于Llama-3.1-8B构建,它使用了1600万个查询-文档对、指令感知的微调和模型合并,将多语言检索统一为一个强大的系统。 这是开源AI和多语言研究的重大胜利。