全球资讯

Meta开源最强多模态大模型Llama 4 实际表现受质疑

自发布Llama3系列开源模型后,Facebook的母公司Meta在当地时间4月5日发布第一批Llama 4系列模型,包括大中小三个模型,首次使用了DeepSeek也在使用的混合专家架构(MoE)。

  【旭才科技】Llama系列开源大模型再升级,但具体表现受质疑。自发布Llama3系列开源模型后,Facebook的母公司Meta在当地时间4月5日发布第一批Llama 4系列模型,包括大中小三个模型,首次使用了DeepSeek也在使用的混合专家架构(MoE)。

  本次发布的模型为Scout(侦察兵)、Maverick(独行侠)和Behemoth(巨兽)。Llama 4 Scout拥有170亿活跃参数和16个专家,为多模态模型,总参数为1090亿。Meta称其性能超过了所有前几代的Llama模型,并且能够在一块NVIDIA H100 GPU上运行。此外,Llama 4 Scout提供了1000万上下文窗口,Meta称,在众多广泛报告的基准测试中,Llama 4 Scout表现优于Gemma 3、Gemini 2.0 Flash-Lite和Mistral 3.1。



Related posts

欧洲央行行长称欧元有望成为美元的替代货币欧洲央行行长克里斯蒂娜·拉加德周一表示,如果各国政府能够加强欧元区的金融和安全架构,欧元有望成为美元的可行替代货币,并为欧盟带来巨大利益。

admin

10月新建商品房网签面积同比增长0.9% 此前连续下降15个月

admin

分析|特朗普宣布美国退出世卫组织,影响几何?

admin