DeepSeek

后起之秀,比肩OpenAI的国产AI!

DeepSeek入口

DeepSeek发展史

  1. 公司成立与早期发展(2023年7月)
    DeepSeek由幻方量化创始人梁文锋于2023年7月创立,总部位于杭州。公司依托幻方量化提供的资金支持和“萤火超算”万卡级算力资源,专注于AGI(通用人工智能)技术的探索。同年7月17日,DeepSeek正式注册为“杭州深度求索人工智能基础技术研究有限公司”,并定位为一家技术驱动型开源AI公司。

    量化巨头重大发布!澎湃号·媒体 …
    量化巨头重大发布!澎湃号·媒体 …


  2. 技术积累与模型发布(2023年11月至2024年初)

    • 2023年11月:DeepSeek发布了首个代码生成模型DeepSeek,该模型支持多语言代码生成,并在HumanEval基准测试中取得82.1%的准确率,展示了其代码生成能力。

      DeepSeek Coder V2开源发布,首超GPT4-Turbo代码能力_腾讯新闻
      2开源发布,首超GPT4-Turbo代码能力_腾讯新闻
    • 2024年1月至5月:DeepSeek实现了MoE(混合专家)架构的创新,发布了国内首个开源MoE模型DeepSeek,并推出第二代模型DeepSeek-V2。这些模型通过引入MLA(多头注意力机制)等技术,大幅降低了推理成本和API定价,显著提升了性能。

      DeepSeek-AI Proposes DeepSeekMoE: An Innovative Mixture-of-Experts (MoE ...
      : (MoE ...
  3. 技术突破与市场影响(2024年中至年底)

    • 2024年5月:DeepSeek发布第三代模型DeepSeek-V3,总参数达到2360亿,成为当时市场上参数规模最大的模型之一。该模型在多项评测中超越了其他同类模型,如Qwen2-7.5B和LLaMA3-1.4B。

      DeepSeek发布236B参数 160位专家的专家混合(…
      发布236B参数 160位专家的专家混合(…
    • 2024年12月:DeepSeek发布了第四代模型DeepSeek-R1,专注于复杂推理任务,展现出卓越的逻辑推理能力。例如,在DROP任务中F1分数达到92.2%,AIME 2024通过率为79.8%。

      久等了,深度求索DeepSeek Coder技术报告发布 - 脉脉
      久等了,深度求索DeepSeek技术报告发布 脉脉
    • 开源策略:DeepSeek采取了开源模式,将模型架构、训练框架及数据开源,降低了AI应用的门槛,推动了AI产业向垂直化应用领域的加速发展。

  4. 全球影响力与商业化应用(2025年初至今)

    • 2025年1月:DeepSeek-R1在全球范围内引发广泛关注,其推理能力在数学、代码和自然语言推理任务中表现优异,甚至超越OpenAI的模型。同时,DeepSeek应用上线仅20天日活用户突破2000万,成为现象级App。

      DeepSeek发布开源Coder …
      发布开源Coder …
    • 市场地位:DeepSeek凭借低成本、高性能的优势,在中美应用商店免费榜中双双登顶,标志着其在全球AI市场的领先地位。

      DeepSeek AI - 晒应用导航
      晒应用导航
  5. 未来展望
    DeepSeek不仅在技术上取得了突破,还通过开源策略和低成本优势,推动了AI产业的民主化和平权发展。其未来将继续深耕大语言模型(LLM)和AGI领域,探索更多应用场景,如教育、科研、知识管理和文档分析等。

的发展历程体现了从初创到全球领先的快速崛起过程。其技术创新、开源策略以及低成本优势使其在全球AI市场中占据了重要地位,并推动了AI技术的普及和应用。

留言评论