阿里云开源全模态模型Qwen2.5-Omni-7B，手机上就能部署

2025 年 3 月 28 日62

【旭才科技】3月27日消息，阿里云宣布通义千问Qwen2.5-Omni-7B正式开源。

Qwen2.5-Omni支持文本、图像、音频和视频等多种输入形式，并实时生成文本与自然语音合成输出。

阿里云介绍，在权威的多模态融合任务OmniBench等测评中，Qwen2.5-Omni全维度远超Google的Gemini-1.5-Pro等同类模型。在语音理解、图片理解、视频理解、语音生成等领域的测评分数，均领先于专门的Audio或VL模型，且语音生成测评分数（4.51）达到了与人类持平的能力。

目前，Qwen2.5-Omni已在魔搭社区和Hugging Face 同步开源，开发者和企业可免费下载商用Qwen2.5-Omni，手机等终端智能硬件也可轻松部署运行。另外，用户也可在Qwen Chat上直接体验。

previous post

中材国际(600970)：2025年国内技改需求有望回暖海外稳健向上

next post

关税风暴下特斯拉“独善其身”：本土化战略成抗风险王牌