朱啸虎投资观念大转变:从质疑大模型到AGI信徒
在创投界,朱啸虎一直以犀利的观点和独特的投资眼光备受关注。这位曾凭借投资滴滴、饿了么等明星项目而声名大噪的投资人,在人工智能领域的投资态度近期发生了戏剧性的转变。从曾经对大模型商业化前景的公开质疑,到如今直言 “我想投资 DeepSeek”,朱啸虎的这一 180 度大转弯,不仅引发了创投圈的广泛关注,更折射出中国科技圈对 AGI(通用人工智能)认知的深刻变革。
朱啸虎早期秉持着 “现实主义” 投资理念,对大模型的商业化之路持悲观态度。他毫不掩饰地指出大模型是 “烧钱游戏”,难以看到清晰的商业化路径,甚至将 AGI 调侃为 “科幻小说里的东西”。在大模型公司融资热潮中,他用行动和言论为市场降温,笃定五年后不会有独立的大模型公司,坚持只投 AI 应用类项目。
然而,与 DeepSeek 团队的深入交流,彻底改变了朱啸虎的看法。DeepSeek 展现出的强大实力和巨大潜力,让他的投资逻辑发生了根本性的转变。DeepSeek 在技术上的突破令人瞩目,其训练成本仅 550 万美元,却能逼近 GPT - 4 水平,这一成本优势让朱啸虎看到了商业落地的可能性。同时,DeepSeek 构建的开源生态,吸引了全球超过 10 万开发者自发贡献代码,形成了难以逾越的技术护城河。在推理成本上,DeepSeek 降低了 40%,进一步增强了其在市场上的竞争力,商业化潜力巨大。
朱啸虎认为,DeepSeek 代表的不仅仅是技术创新,更是 “下一代基础设施”。他预测 DeepSeek 有望成为 “AI 时代的 Linux”,在他的估值逻辑里,DeepSeek 的估值未来有望突破千亿美元。这一投资意向的背后,是朱啸虎对赛道的精准判断和对 DeepSeek 未来发展的坚定信心。
DeepSeek 的成功,离不开其在开源产品上构建的多重壁垒。在技术层面,DeepSeek 的 MLA 架构让单次交互能耗降低 40%,远超行业平均水平,通过合成数据技术减少对标注数据的依赖,形成独特的数据护城河。在生态方面,强大的开发者社区是其重要优势,全球开发者的积极参与,形成了庞大的生态网络。从行业应用来看,DeepSeek 的开源模型已经渗透到医疗、教育、金融、制造等各个垂直领域,为各行业的智能化升级提供了有力支持。在商业上,低成本优势和场景化能力是 DeepSeek 的两大法宝,训练成本仅为行业平均水平的 1/3,通过微调模型适配不同行业需求,形成了差异化竞争优势。
当前,算力困境是人工智能发展面临的一大挑战。高端芯片供应受限,算力成本居高不下,高质量标注数据稀缺,训练效率难以提升。而 DeepSeek 通过算法优化和数据创新,提供了有效的解决方案。其 MLA 架构和 FP8 混合精度训练,大幅降低了算力需求,利用合成数据技术减少对标注数据的依赖,提升了训练效率。从未来趋势来看,边缘计算和算法补偿将成为重要方向,将 AI 模型部署到终端设备,减少对云端算力的依赖,通过算法优化弥补硬件代差,降低对高端芯片的依赖。
在闭源模型与开源模型的竞争中,朱啸虎认为闭源模型的窗口期已过。闭源模型成本高企,训练和推理成本远高于开源模型,且生态封闭,难以形成强大的开发者社区,创新速度受限。虽然闭源模型在垂直领域(如金融、医疗)和高端市场有一定机会,通过定制化服务满足特定需求,但开源模型正在成为主流,代表了 AI 发展的未来方向。
从 “数据驱动” 到 “认知革命”,数据在人工智能发展中至关重要。高质量、多样性的数据是训练智能模型的基础,决定了模型的性能和泛化能力。而认知革命的本质是通过深度学习将海量数据转化为结构化知识,再利用强化学习和元学习提升模型的自主决策能力。
朱啸虎的这一转变,不仅仅是个人投资信仰的觉醒,更反映出整个创投圈对 AGI 认知的变革。当以现实主义著称的投资人都开始转变观念,或许预示着 AGI 元年的脚步已越来越近。
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。