梁文锋署名论文,DeepSeek首轮融资后大动作:生成速度大涨85%
DeepSeek在完成500亿元首轮融资后,于6月27日开源了推理加速方案DSpark及配套训练框架DeepSpec。该方案推出DeepSeek-V4-Pro-DSpark和DeepSeek-V4-Flash-DSpark两款模型,通过增加推测解码模块提升推理速度并降低成本。据梁文锋署名、与北京大学合作的论文,DSpark采用半自回归架构与置信度调度校验机制,在真实用户流量测试中,相比成熟基线方案,单用户生成速度提升60%至85%,同时避免了高并发场景下的吞吐率大幅下降。DeepSpec则提供了完整的训练与评估工具链,支持DSpark、DFlash和Eagle3等算法,开发者可将其用于优化Qwen3、Gemma等模型的推理性能。此次发布标志着DeepSeek在融资后率先聚焦推理优化,旨在加速模型产品化并提升算力效率竞争力。
本文摘要由千智坊基于公开报道整理,查看完整内容:阅读原文(36氪)→
