全球资讯

阿里发布新一代开源模型Qwen3 部署门槛大幅降低

4月29日,阿里巴巴发布了新一代开源大模型系列Qwen3。图:视觉中国

  【旭才科技】开源大模型竞赛持续。4月29日,阿里巴巴发布了新一代开源大模型系列Qwen3,阿里巴巴称新模型总参数量仅为DeepSeek-R1的三分之一,部署门槛大幅降低,同时其性能优于DeepSeek-R1。用户可以通过阿里云的企业平台或通义App直接体验该模型,夸克也将接入Qwen3。

  Qwen3的旗舰模型采用混合专家(MoE)架构,从36T的数据量上训练而来,总参数量为235B,激活参数量为22B。作为对照,同样采用MoE架构的DeepSeek-V3在14.8T的数量上训练而来,总参数量为671B,激活参数量为37B。



Related posts

国风|高考报名人数七年来首降

admin

特朗普签行政令继续打压高校 百余校长发联名信抗议

admin

屠新泉:美国谋求回到19世纪 这是历史上最大的经济实验

admin