lakebbs
返回

DeepSeek创始人梁文峰

Chill guy2025-01-28 06:06 EST
1. 本科/研究生期间在浙江大学攻读机器视觉方向 2. 2015 年,30 岁时创立了「High-Flyer」量化对冲基金 3. 通过量化对冲交易积累了可观财富(目前管理规模约为 80 亿美元) 4. 希望在主业之外构建“类人水平”的人工智能,但最初向合作伙伴提出想法时遭到质疑 5. 2021 年采购了 10,000 颗 H800 芯片,并将其对冲基金里最顶尖的员工带到新项目团队(这些员工在挖掘英伟达 GPU 性能方面拥有丰富经验) 6. 2023 年正式成立 DeepSeek,招聘数十位来自北京大学、清华大学、北京航空航天大学等顶尖高校的博士 在中国,为技术人才提供与字节跳动同级别的顶尖薪酬,目标是将 DeepSeek 打造成领先的“本土”AI 公司 7. 由于美国的出口管制,DeepSeek 团队不得不另辟蹊径,通过创新的训练方法,让其 LLM 模型(V3、r1)在性 能上可与 OpenAI、Anthropic、Gemini、Grok、LLaMA 等相媲美,且成本约为后者的二十分之一 8. 虽然训练成本对比并不完全具备可比性,但通过独创方法大幅提升了效率(也有传闻称可能借鉴其他模型、或拥有更大规模的 H-100 集群,甚至获得政府支持等) 9. DeepSeek 开源并发表了相关方法(r1 推理论文集结了 200 多位作者) 10. DeepSeek 近期在 App Store 排行榜上位居首位
0
登录后参与讨论登录
还没有评论 · 来做第一个评论的人

猜你也想看