deepseek 大模型生态报告

《deepseek 大模型生态报告》由赛迪研究院电子信息研究所发布，深度剖析了 DeepSeek 大模型的发展状况，涵盖背景、技术、产业生态等多个方面，展现其在人工智能领域的重要影响力。

DeepSeek 大模型背景：由幻方量化于 2023 年 7 月创立，专注开发大语言模型。发布了 DeepSeek LLM 等多个模型，如 DeepSeek V2 推理成本低，DeepSeek-R1 性能逼近 OpenAI o1 且成本低，相关应用在苹果应用商店表现优异，日活跃用户数增长迅速。研发团队年轻，成员多来自国内顶尖高校，在关键技术创新上成果显著。

技术特点：通过 MLA 和 FP8 混合精度训练框架压缩数据，减少运算数据量和内存占用，提升训练效率且保证模型性能；运用 DualPipe 跨节点通信、无辅助损失的负载均衡策略和底层通信优化等技术，极限压榨算力，提高训练速度。DeepSeek-V3 训练成本低，仅用 557.6 万美元预算，在 2048 个 H800 GPU 集群上训练，性能与其他高成本模型相当。

产业生态：华为小艺、三大运营商、多家云厂商、车企、券商等纷纷接入，燧原科技实现其全量模型推理服务部署；Deepseek 应用登顶苹果应用商店下载排行榜，在 GitHub 上 Star 数超越 OpenAI，国家超算互联网上线其模型，或适配中国国产 GPU，众多终端企业也接入。在文学辅助网文创作和编程代码生成等方面应用出色，性价比高。

产业影响：展示了开源模式的优势，冲击闭源大模型，引发对智算中心需求的讨论，改变国际竞争格局，影响全球资本市场。中国对其表示支持，部分国家和企业对其有不同态度，涉及限制使用、质疑侵权等情况。

经验启示：对比中科院，DeepSeek 在制度、创新效率等方面具有优势，中国可借鉴其经验构建科技创新共同体。在具身智能领域，DeepSeek 推动中国 AGI 自主创新，具身智能发展需开源、标准化和产业化，中国应把握机遇。同时，人工智能对国家安全影响深远，需构建新治理体系；巴黎 AI 峰会强调以人为本治理 AI；人工智能还驱动信息技术体系重构再造，中国应聚焦关键问题、布局基础设施。从企业创新和地方发展角度，DeepSeek 的创新模式具有借鉴意义，其成功也凸显了杭州和张江在创业环境上的差异。提取码:uMDD

下载

在博客

odoo下的静态文件访问方法