压力给到梁文锋

admin 商业 2025-04-19 1 0

摘要:

根据 DeepSeek 过往的产品更新周期来看,梁文锋的主场时间又快到了。

来源|《中国企业家》杂志

作者|闫俊文

编辑|张晓迪

这两天,中美大模型公司各有大事发生。

4 月 15 日凌晨,OpenAI 发布了 GPT-4.1 系列模型,包括 GPT-4.1、GPT-4.1 Mini、GPT-4.1 Nano,它们的核心特征是成本更低,速度更快;同一天,另一家中国明星 AI 公司,智谱 AI 正式启动上市辅导备案,由中金公司担任辅导机构。备案报告显示,智谱 AI 将在今年 8 月至 10 月完成 IPO 辅导计划。

此前的 3 月底,智谱 AI CEO 张鹏曾告诉《中国企业家》,他判断实现 AGI,路程还长," 不管我们融了多少钱,其实都是 AGI 道路上的盘缠,未来,还需要更多盘缠,我们会持续地做相关的事情 "。

如今看来,这个 " 更多的盘缠 " 就是指 IPO。

2025 年开年,DeepSeek" 燃爆 "AI 圈,目前,截至 R1 模型正式发布已经过去 86 天。

DeepSeek 和梁文锋的团队什么时候推出新的大模型产品,尤其是 R1 的更新版?

《中国企业家》统计了国外 Anthropic、Meta 等公司更新大模型的周期,如果是模型的重大升级,周期在 5 至 10 个月左右;而同一版本的功能升级则在 3 至 4 个月之间。

根据 DeepSeek 官网数据,梁文锋的 AI 团队更新产品与国外主流公司同频,2024 年 9 月发布 V2.5,12 月发布 V3,2025 年 3 月将 V3 更新为 V3-0324 版本,也几乎每隔 3 个月就会迎来一次升级。

有一些预测认为,DeepSeek 下一次更新 R1 模型可能是在 5 月初,届时或提前发布,但 DeepSeek 方面目前还尚未对这种预测进行回应。

OpenAI 也在追求更小更快

公开资料显示,GPT-3 的参数规模为 1750 亿,GPT-4 的参数规模为 1.76 万亿,到了 GPT-4o 参数约 2000 亿规模,此次 OpenAI 推出的 GPT-4.1 Mini,被称作 OpenAI 的高效小型模型,在多个基准测试中表现超越 GPT-4o,大幅减少延迟并降低 83% 成本。

GPT-4.1 Nano 被称之为首个超小型模型,它能支持 100 万 token 的上下文窗口,适用于低延迟任务,如分类和自动补全。

值得注意的是,上述三个模型将上下文窗口处理的规模从 GPT-4o 的 128K 直接提升至 100 万 token(1M)。这意味着模型在更长的文本中保持专注和理解的能力得到了强化。

具体到成本、价格方面,GPT ‑ 4.1 比 GPT ‑ 4o 便宜 26%,输入、输出分别是每百万 token2 美元和 8 美元;GPT ‑ 4.1 Nano 输入、输出分别为 0.1 美元和 0.4 美元。

对比 DeepSeek,标准时间段内,V3 模型输入、输出百万 token 的费用为 0.5 元、8 元,R1 推理的费用分别为 1 元和 16 元。

可以说,OpenAI 也打上了 token 的价格战,价格直接对标 DeepSeek。

与此同时,OpenAI 已暂停了其此前 2 月发布的 GPT-4.5,原因在于成本太高,其 API 定价为输入、输出每百万 token75 美元、150 美元。官方回应说此次调整旨在将更多资源投入未来模型的研发。

关于开源,OpenAI 的 CEO 山姆 · 阿尔特曼不得不走向与 DeepSeek 同样的路径,他曾表示,DeepSeek 的出现并未影响 GPT 的增长,OpenAI 将推出更好的开源模型。

不过,在 DeepSeek 冲击之下,阿尔特曼曾经一度非常恼火,甚至恐慌,他曾在社交平台上指责 R1 模型使用了 GPT 的数据蒸馏,又写公开信给美国政府,声称限制 AI 技术流向中国等国家,并禁用 DeepSeek。

但这并不影响 DeepSeek 的影响力。在英伟达的 2025GTC 开幕主题演讲会上,黄仁勋数次提到 R1 模型,并用 R1 模型验证了黄仁勋所谓的 " 推理越多,所需算力越多 " 的说法。

除了 OpenAI,谷歌在 4 月 9 日也举办了发布会,宣布推出 Agent2Agent 智能体交互协议,该协议允许生态系统中的 AI 智能体进行底层技术无关的相互操作。多个智能体的协作将带来更高的自主性,同时成倍提高生产力、降低长期成本。

梁文锋的主场时间又快到了

在 R1 模型 " 爆火 " 之后,DeepSeek 除了模型升级,人事布局上动作颇多,DeepSeek 官网在 3 月份发布了招聘 CFO、COO、财务负责人岗位的信息。这也被一些媒体解读为 DeepSeek 在为融资做准备;模型方面,DeepSeek 最大的动作是 3 月 25 日发布了 V2 模型的更新版。

目前,DeepSeek 并未发布有关融资方面的信息。4 月 3 日,梁文锋和团队发表了一篇论文,题目是《通用奖励建模的推理时间缩放》,文章论述了如何让注意力机制更高效地处理更长的上下文等。

DeepSeek" 燃爆 "AI 圈后,外界对其充满好奇和新的期待。潞晨科技 CEO 尤洋近期在接受《中国企业家》采访时说,如果有机会跟梁文锋面对面,他最想问梁文锋的是他最终的目标是什么," 梁文锋是想做一个成功的商业化公司,还是想通过一些其他手段做一些非盈利的事情?这两者肯定差距是非常大的,OpenAI 可能还是想做一个 Google 那样的非常高价值的商业化公司。"

记者了解到,目前,无论是杭州本地的大公司,还是深圳的顶级创投,都难见梁文锋一面。

近期英伟达公开表示,美国政府正在限制其 H20 芯片向中国的出口,并且 H20 芯片对华出口需要获得许可证,这一要求是 " 无限期 "。

而 H20 芯片正是梁文锋最在意的 " 基础设施 ",早先,梁文锋在接受媒体采访时说," 我们真正的挑战从来不是资金,而是高端芯片的出口禁令。"

不过,面对禁令,梁文锋也并非坐以待毙,他曾在接受媒体采访时说," 英伟达的 GPU 没有什么神秘之处,但要赶上他们,就必须重建团队、付出时间和成本,追赶下一代技术——这才是真正的护城河。"

等不及在车里就要了我云译网

主人我错了能不能关掉开关小说

「活动」注册就送新人大礼包

84.29MB
版本V9.84.14
下载家雀儿(1V2)安装你想要的应用 更方便 更快捷 发现更多
喜欢 18%好评(87人)
评论 40
丫头我想听你叫0 他的小草莓全文免费阅读1 想吃你前面的那两个大馒头2 甜宠乳尖1V33 女仆之耻辱心4
详细信息
  • 软件大小: 81.23MB
  • 最后更新: 2024-09-16 18:34:53
  • 最新版本: V8.28.17
  • 文件格式: apk
  • 应用分类:ios-Android 熟睡中的mm任我玩
  • 使用语言: 中文
  • : 需要联网
  • 系统要求: 5.41以上
应用介绍
一,潋滟txt奶糖不甜,内裤子奇缘全集
二,隔壁肉香,厉总离婚请别怂
三,戏里戏外(1V1),陈瑾宁
四,压在稚嫩的身体上耕耘,豪门千金归来
五,恐慌沸腾txt,啊好爽老师你水好多
六,乐可免费阅读全文阅读,余下全文无防盗百度百科
七,全篇肉高H秘书被C办公室AV,角色扮演系统(NPN)赵青蔓

【联系我们】
客服热线:139-8888-666
加载更多
版本更新
V1.22.17
篮球队的公共玩具笔趣阁,骄阳伴我小说

秘密教学105话我需要灭歪歪

猜你喜欢

包含 饿了么 的应用集
评论
  • 三个军人1v3 4天前
    末世狩猎者
  • 学渣含着学霸的攻写作业 7天前
    余震TXT肉酱意面
  • 18jzjzz 7天前
    好涨水快流出来了快吃动阅读
  • 小鸟acome 6天前
    夹心饼干PO1V3小
  • 梁教授要稳住TXT肉馅小水饺 2天前
    风流寡妇小说
  • 师父是全派的炉鼎 4天前
    在佛堂她骑了他七回古言
  • 快穿文攻略高冷老师h 5天前
    吞花1V3作者橙子皮香小说
  • 大团圆结2高敏笔趣阁 4天前
    地狱的第十九层
  • 滋味1v2商洛林深悄悄 4天前
    快穿之吃肉之旅
  • 我可以触碰你深处的樱花吗 9天前
    曼娜回忆录续