山东商报·速豹新闻网记者 吴绍博
一场由 DeepSeek 引发的“科技海啸”正在席卷全球资本市场。
1月27日一早,DeepSeek在中国区和美国区苹果App Store免费榜上同时冲到了下载量第一,超过原先霸榜的ChatGPT,这也是国产应用首次实现这一成就,遥遥领先于其他竞争对手。
2月8日,据QuestMobile数据显示,DeepSeek在1月28日的日活跃用户数首次超越豆包,随后在2月1日突破3000万大关,成为史上最快达成这一里程碑的应用。
这家成立仅一年的初创企业,凭借其开源大模型R1和Janus-Pro的横空出世,不仅撼动了英伟达、台积电等芯片巨头的市场地位,更让美股科技板块单日蒸发超万亿美元市值。美国总统特朗普更是公开表示,DeepSeek的出现“给美国相关产业敲响了警钟”。
打破英伟达的算力霸权
DeepSeek的母公司杭州深度求索人工智能基础技术研究有限公司成立于2023年7月,至今也不过一年半时间。虽然成立时间短,但DeepSeek的出现却震惊了全世界。
2025年1月20日DeepSeek发布大模型DeepSeek-R1。DeepSeek-R1一经发布,便在多个国家热度居高不下。1月27日,DeepSeek在苹果App Store中国区、美国区免费应用下载榜上双双登顶,超越Chat GPT。不仅受到用户关注,DeepSeek也成为行业人士的热议话题。
微软CEO萨提亚·纳德拉则认为,DeepSeek“有一些真正的创新”。AI成本下降是趋势。Meta创始人兼CEO马克·扎克伯格表示,Meta将DeepSeek视为新的竞争对手并正在学习,但现在判断AI基建、资本支出等方面还为时尚早。OpenAI创始成员An-drej Karpathy在看到DeepSeek的成绩之后,毫不吝啬地表达了赞赏,他认为深度求索(DeepSeek)在资源受限的情况下展现出了极高的研究和工程能力。
事实上,AI成本的下降是让DeepSeek能够从诸多大模型中脱颖而出的重要原因。据DeepSeek官网显示,API的定价每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens 16元。这个收费相当于Open AI o1运行成本的约三十分之一。DeepSeek也因此被迅速冠以“AI界拼多多”之称。
据悉,DeepSeek-V3训练成本仅557.6万美元,而OpenAI训练ChatGPT-4o所花费的成本高达7800万美元甚至是1亿美元,双方的成本至少是10倍的差距。此外,DeepSeek-V3在数学、代码能力和中文知识问答方面还超过了ChatGPT-4o,可以说是性价比超高。
ChatGPT的母公司OpenAI以及其他美国公司,一向以大力出奇迹著称,用大量的芯片堆模型,耗钱、耗电、费时,这都形成了行业共识和路径依赖。DeepSeek的横空出世,彻底打破了“芯片越贵算力越强”的传统,颠覆了英伟达在算力领域的芯片霸权。因此,美国时间1月27日收盘,英伟达股价下跌近17%,收报118.42美元,单日的市值蒸发规模达到5890亿美元,为美国股市历史上最大单日跌幅。
17岁考入浙大的天才
提起DeepSeek,就不得不说起它的缔造者,梁文锋。
1985年,梁文锋出生于广东湛江,2002年,年仅17岁便以状元的身份考入浙江大学电子信息工程专业。2007年,22岁的梁文锋又考上浙江大学信息与通信工程专业研究生。师从项志宇,主要做机器视觉研究。2008年至2014年,梁文锋一直在探索全自动量化交易。2013年,28岁的梁文锋与同样来自浙江大学的同学徐进一起创办了杭州雅克比投资管理有限公司。2015年6月,30岁的梁文锋与徐进一起加入阳光私募大军,在浙江杭州创办了杭州幻方科技有限公司(公司英文名High-Flyer),也就是现在的浙江九章资产管理有限公司。梁文锋及其团队开始依靠数学与人工智能进行量化投资,立志成为世界顶级的量化对冲基金。2016年梁文锋31岁,到年底时,他们管理的资金规模已经大约10亿元。2017年,32岁的梁文锋带领幻方继续扩大AI算法研究团队和AI软硬件研发团队,到2017年底,几乎所有的量化策略已经都采用AI模型计算。他们管理的资金规模也扩大到30亿元。2018年,梁文锋确立公司以AI为主要发展方向,幻方量化也首次获得了私募金牛奖——这是中国私募证券领域的最高奖项。此时幻方量化也遇到了算力瓶颈,日益增加的训练需求受限于有限的计算资源,梁文锋开始寻求大规模算力解决方案。
2019年,梁文锋创办幻方AI公司,投资2亿元自主研发深度学习训练平台“萤火一号”,为此搭载了1100块GPU显卡。2021年8月,梁文锋带领幻方量化的资金管理规模突破千亿大关,正式跻身千亿量化私募之列。2023年7月,梁文锋创办了杭州深度求索人工智能基础技术研究有限公司,就是DeepSeek公司。梁文锋被认为是量化投资者投身AI创业的“第一人”,实际上在幻方创业时,梁文锋的公司也早就用上了AI技术。
2024年5月,39岁的梁文锋带领深度求索(DeepSeek)发布了混合专家语言模型DeepSeek-V2。2024年10月,梁文锋的幻方量化向投资者发布公告,宣布未来会逐步将对冲产品投资仓位降低至零。
2024年12月26日,梁文锋又带领深度求索公司发布了DeepSeek-V3,并且还公开了由梁文锋、罗福莉等人撰写的53页论文《DeepSeek-V3 Technical Report》。
除了梁文锋之外,深度求索拥有一支由国内名校组成的强大人才团队,甚至不少人都是应届毕业生和刚毕业没几年的年轻人。有业内人士一语中的:“创新需要摆脱惯性。”比如深度求索的朱琪豪是2024届北大计算机学院软件研究所博士毕业生;代达劢是2024年北京大学计算机学院计算语言所的博士毕业生;郭达雅是2023年中山大学博士毕业生等。
梁文锋曾在接受采访时表示,“如果追求短期目标,找现成有经验的人是对的。但如果看长远,经验就没那么重要,基础能力、创造性、热爱等更重要。”
DeepSeek有多厉害?
DeepSeek究竟厉害在哪?可以用几个词概括——性能强大、开源、免费。DeepSeek不仅在自然语言处理、机器学习等核心技术领域展现了卓越的性能,还在实际应用中提供了更加流畅、精准的交互体验。无论是复杂的查询处理,还是日常的对话交流,DeepSeek 都能以接近人类的反应速度和理解深度,满足用户的多样化需求。
深度求索公司此次大胆采取开源策略,公开DeepSeek的核心代码,旨在推动全球AI技术的共同进步。这一举措不仅促进了技术的透明度和安全性,更为全球开发者提供了一个学习和创新的平台,加速了AI技术的普及和应用创新。DeepSeek的免费提供,是深度求索公司致力于消除技术壁垒,让更多人享受到人工智能带来的便利和好处的明证。无论是个人用户还是企业客户,现在都能无需承担高昂成本,即可体验到顶尖的AI技术。
浙商证券大模型研究报告认为,“DeepSeek是搅动全球模型市场的一条鲇鱼,带来性能、价格、开源三重冲击。自此,ToB端应用、AI端侧应用将最受益于大模型的开源趋势、成本降低、迭代加速。”截至目前,已有多家券商、基金宣布完成DeepSeek开源模型的本地化部署,不少公募基金也正探索上述系列开源模型的业务应用场景。
2月6日晚,国金证券(600109.SH)、国元证券(000728.SZ)、华福证券等中小型券商宣布已完成DeepSeek本地化部署测试。该消息一出,券商股在2月7日反应热烈,华林证券(002945.SZ)一度涨停,国金证券涨近6%,券商板块集体拉升。除金融行业密集进行本地化部署外,不少行业巨头也纷纷宣布接入DeepSeek接口。
2月8日,腾讯云发布消息,上线了DeepSeek-R1和V3原版模型的API接口,除此之外,还将它们接入了大模型知识引擎,并支持联网搜索。基于DeepSeek,在操作上,只需拖拽几步,就能搭建一个集“智能问答+知识管理+实时搜索”于一体的AI应用。
据了解,金山云(03896.HK)、东风股份(600006.SH)、恒瑞医药(600276.SH)、每日互动(300766.SZ)、万达信息(300168.SZ)、三六零(601360.SH)等公司均已公开宣布接入DeepSeek模型。