文| 博阳
编辑|郑可君
近日,市场再度传出深度求索(DeepSeek)下一代大模型 DeepSeek-R2 的发布消息,预计时间窗口为 8 月 15 日至 30 日。受此消息影响,8 月 12 日早盘,人工智能概念股集体拉升,寒武纪等个股涨幅显著。
8 月 13 日,接近 DeepSeek 人士向腾讯科技表示,该消息不实,并确认 DeepSeek-R2 在 8 月内并无发布计划。
这已是该备受瞩目的模型年内第二次传出发布消息后又归于沉寂。回顾深度求索近半年的动态,其重心并非推出全新一代模型,而是对现有产品线进行"小步快跑"式的迭代优化。
今年 3 月,深度求索公司对约 660B 参数的 DeepSeek V3 模型进行升级,提升了推理、编程及中文处理能力;5 月底,又推出了 DeepSeek-R1-0528 版本,该版本通过在后训练阶段投入更多算力,显著增强了模型的思维深度与推理能力,并在改写、摘要等多个场景下将"幻觉率"大幅降低了 45% 至 50%。
对于 R2 模型为何迟迟未能面世,外媒 The Information 于 6 月的报道揭示了两个可能的核心原因。其一,尽管研发团队已投入数月高强度开发,但公司 CEO 梁文锋对新模型的性能表现尚不满意。其二,公司或面临算力储备紧缺的困境。据报道,由于英伟达 H20 芯片的意外禁售,深度求索的算力储备受到影响,公司担心新模型一旦上线,短时间内激增的调用量可能会因算力不足而导致用户体验不佳。
炒股入门与技巧,配资低息炒股配资门户,炒股配资最新提示:文章来自网络,不代表本站观点。