跳至内容

deepseek 大模型生态报告

deepseek 大模型生态报告

《deepseek 大模型生态报告》由赛迪研究院电子信息研究所发布,深度剖析了 DeepSeek 大模型的发展状况,涵盖背景、技术、产业生态等多个方面,展现其在人工智能领域的重要影响力。

DeepSeek 大模型背景:由幻方量化于 2023 年 7 月创立,专注开发大语言模型。发布了 DeepSeek LLM 等多个模型,如 DeepSeek V2 推理成本低,DeepSeek-R1 性能逼近 OpenAI o1 且成本低,相关应用在苹果应用商店表现优异,日活跃用户数增长迅速。研发团队年轻,成员多来自国内顶尖高校,在关键技术创新上成果显著。

技术特点:通过 MLA 和 FP8 混合精度训练框架压缩数据,减少运算数据量和内存占用,提升训练效率且保证模型性能;运用 DualPipe 跨节点通信、无辅助损失的负载均衡策略和底层通信优化等技术,极限压榨算力,提高训练速度。DeepSeek-V3 训练成本低,仅用 557.6 万美元预算,在 2048 个 H800 GPU 集群上训练,性能与其他高成本模型相当。

产业生态:华为小艺、三大运营商、多家云厂商、车企、券商等纷纷接入,燧原科技实现其全量模型推理服务部署;Deepseek 应用登顶苹果应用商店下载排行榜,在 GitHub 上 Star 数超越 OpenAI,国家超算互联网上线其模型,或适配中国国产 GPU,众多终端企业也接入。在文学辅助网文创作和编程代码生成等方面应用出色,性价比高。

产业影响:展示了开源模式的优势,冲击闭源大模型,引发对智算中心需求的讨论,改变国际竞争格局,影响全球资本市场。中国对其表示支持,部分国家和企业对其有不同态度,涉及限制使用、质疑侵权等情况。

经验启示:对比中科院,DeepSeek 在制度、创新效率等方面具有优势,中国可借鉴其经验构建科技创新共同体。在具身智能领域,DeepSeek 推动中国 AGI 自主创新,具身智能发展需开源、标准化和产业化,中国应把握机遇。同时,人工智能对国家安全影响深远,需构建新治理体系;巴黎 AI 峰会强调以人为本治理 AI;人工智能还驱动信息技术体系重构再造,中国应聚焦关键问题、布局基础设施。从企业创新和地方发展角度,DeepSeek 的创新模式具有借鉴意义,其成功也凸显了杭州和张江在创业环境上的差异。提取码:uMDD

下载

博客
odoo下的静态文件访问方法