DeepSeek团队研究：相信长期主义开源理念可扩展大语言模型

: 资料图：DeepSeek。图：视觉中国

　　【旭才科技】中国人工智能初创企业DeepSeek（深度求索）正给全球科技市场带来震撼。2025年初，DeepSeek发布新一代推理模型R1，该模型在性能上与OpenAI的o1模型相当，训练成本却仅为557.6万美元，仅为Meta训练大模型纯算力成本的1/10。这一突破在全球AI领域和资本市场引发了巨大震动。R1模型的开源、低成本和高性能也成为全球技术界的焦点。

　　2024年1月，DeepSeek大语言模型团队曾在预印本平台ArXiv发表论文《以长期主义扩展开源语言模型》，深入研究并探讨了他们对于开源模型规模效应（scaling law）的理解。基于对规模效应的研究和理解，团队实现了DeepSeek Chat模型，此后发布的多个升级版本至R1，都是基于DeepSeek Chat模型逐步升级改造而来。

旭才科技 | 全球财经

暴涨暴跌一日游！50倍“妖王”药捷安康被“打回原形” 相关创新药ETF承压前行

基金代销江湖变局：谁的份额萎缩？谁在加速抢食？

美国可转债市场今年表现强劲跑赢美股及高收益债券

兴业证券：美联储降息后各大类资产如何表现？

9月17日财经早餐：静待美联储降息，金价触及3700上方，美印贸易谈判积极

美联储今夜将降息！内部现历史性分歧，美元何去何从？

生猪产能调控企业座谈会召开会上谈及控制母猪产能等内容

长安期货范磊：降息来临地缘波动油价短线或上行

特朗普与莫迪通话寻求缓解紧张局势

美联储利率决议前夕美元一度逼近三年低位

DeepSeek团队研究：相信长期主义开源理念可扩展大语言模型

Related posts