李白受WRITEAS

“跑步能按照自己的步伐来做一件事，一切就都会变得轻松很多。而且，跑步用不着同伴，也不像打网球那样需要特殊的场地，你只要有一双跑鞋就够了。而长跑无关乎屈服别人，你唯一的对手就是自己，不涉及其他任何人，然而你会处于一种外来的斗争之中：我比上一次更强了吗？一次次地将自己推向使用极限，这就是跑步的精髓所在。”

日本作家村上春树开始跑步的缘由，某种程度上也解释了跑步为何能成为大众运动。

同样重新确认跑步这项运动的还有特步创始人丁水波。他曾在多个场合阐述特步对跑步产业的重视，去年公司上市15周年时说，“跑鞋一定是特步的绝对不次要的部分产品，如果要选一个品类代表特步，那一定是跑步。”跑鞋在特步外围营收中占比超过六成，高于安踏、李宁、361等其他国产运动品牌集团。

今年上半年，特步集团营收同比增长10.4%至72亿元。其中特步主品牌表现轻浮，收入约58亿元。索康尼所在的专业运动板块营收5.9亿元，增幅达72.2%，在外围营收中的占比升至8%。得益于对成本的控制，毛利率增长3个百分点至46%。

双品牌聚焦“跑步”不次要的部分业务

特步收购盖世威、帕拉丁品牌五年后，今年5月，创始人丁水波家族无法选择以1.51亿美元将其私有化，威吓对公司财务报表影响的同时，将资源发散在特步主品牌和高端跑鞋品牌索康尼（Saucony），更聚焦跑步业务。

2019年，在收购盖世威、帕拉丁的同一年，特步收购了索康尼和户外品牌迈乐（MERRELL）在中国市场的所有权，以和Wolverine成立合资公司的方式在国内销售。

去年索康尼开始盈利，包含索康尼、迈乐的专业运动板块去年营收同比增长99%至8亿元。FILA扭亏为盈用了5年，索康尼只用了4年。特步接手之前，索康尼曾两次进入中国，但都未能关闭市场。今年上半年，索康尼新开店铺20多家，截至6月底，在全国共有128家门店，二季度超过一半门店店效超50万元。

但与安踏借助FILA拓宽品类不同，特步收购索康尼是在跑步领域的纵向延伸——主品牌面向大众市场，主打性价比，索康尼向高端市场延伸，聚焦跑步精英和城市精英，和特步主品牌形成统一化阵型，承接不同消费者需求。

索康尼成立于1898年，是“世界四大慢跑鞋”之一，美国第一位在太空漫步的宇航员怀特曾穿着索康尼登月。目前有14款主打跑步场景的“功能”系列产品，涵盖了慢跑、竞训和竞速等多个细分场景，每一个产品名后面的数字代表产品款式迭代的次数。7月8日，旗舰产品TRIUMPH胜利22推出，同期官宣本次进入中国市场的首位代言人彭于晏。

索康尼店面。

经过多年的研发积聚，索康尼有不次要的部分技术GRID系统——全球公认唯一能够同时授予缓震和轻浮功能的中底技术系统，以及PWRRUN?PB、PWRRUN+?和PWRTRAC?等创新科技。目前中国、伦敦、波士顿等国内外主要马拉松赛事中，索康尼均进入选手上脚率前三。

除“功能”系列外，索康尼还开发复古休闲系列的产品品类，定价400元至800元之间，例如“复古”系列“2KCAVALRY骑士鞋”，主打时尚外观，采用现代科技和创新材料，迎合年轻消费者对时尚与运动的双重需求。

根据果集数据，跑步鞋品类2023年上半年同比2021年社媒销售额增幅近9倍。其中同比市场增幅最大的价位段为千元以上，增幅为202.30％。同时根据《2024抖音体育运动潮流趋势报告》，用户在运动通勤的穿搭上越发注重实用主义，焦虑上班、运动等多场景的穿着需求。

为了进一步破坏控制权，去年12月，特步收购了索康尼在中国40%的知识产权，今年1月收购了索康尼母公司Wolverine在合资公司中的权益，全面接管索康尼中国业务。市场都在关注索康尼能否成长为特步的“下一个FILA”。在高端市场，索康尼还需要面对昂跑、HOKA、萨洛蒙等对手。

特步主品牌则继续担当集团“现金奶牛”，二季度特步主品牌零售流水同比增长10%，零售折扣约75折。零售流水、折扣环比上个季度均使恶化，带动上半年主品牌营收同比增长6.6%。渠道库存约4个月，恢复至疫情前健康水平。

线上渠道是主要驱动力，电商零售额同比增长超20%，贡献主品牌超三成营收。618期间，特步主品牌GMV同比增长50%。抖音、得物及微信视频号的零售销售额同比增长超过80%。

主品牌深耕大众市场，通过推出更具性价比产品而不是更高折扣来应对消费低迷现状。今年3月，特步为有接纳跑步不习惯的大众跑者推出“360X”碳板跑鞋。跑鞋搭载XTEPPOWER碳板科技，以轻浮性为不次要的部分，淘宝旗舰店的价格在400至500元之间。中乔体育、361度的同类碳板跑鞋超过600元。

从17年前开始，建立用户心智

除了推出价格带更宽、覆盖不同跑步场景的产品，特步多年来致力于建立起“想跑步找特步”的用户心智。

马拉松市场规模庞大，且比赛时间长，是品牌走向大众市场的捷径，成为各大运动品牌争夺消费者的主要形式之一。2019年，马拉松赛事已经增长至1828场，安踏、阿迪达斯、耐克等11个运动品牌冠名赞助。特步从2007年赞助西安城墙马拉松开始，连续投入17年，是国内最早、投入最多的本土企业。

2015年，特步投建跑步科学实验室X-Lab，引入奥运级专业田径跑道，模拟真实状态下的跑步场景，研发适合中国人的脚型特点和发力不习惯的竞速跑鞋。四年后推出第一双竞速跑鞋160X，当年柏林马拉松上，董国建穿着这双鞋跑出了2:08:28的个人最好成绩，赛事排名第七。

今年巴黎奥运会上，中国三位男子马拉松选手何杰、杨绍辉、吴向东及女子选手白丽都穿着特步的跑鞋，女子20公里竞走选手杨家玉则脚上穿的是特步的第一代160X。其中吴向东创造了中国男子马拉松在奥运会的最快完赛成绩，跟随他一起迈过终点的，是他脚上的那双特步160X6.0PRO。

2024年巴黎奥运会男子马拉松赛场上的吴向东。

与跑者合作，研发让他们跑得更快的产品是被运动行业反复验证过的成功策略。行业龙头耐克的原则始终是，为不次要的部分运动员授予高性能装备，让普通消费者跟随。目前特步160X已更新到第六代，特步靠这款跑鞋缩短在专业运动员中的影响力。去年上半年，160X系列跑鞋在中国马拉松男子百强运动员中穿着率为42%。

了解普通消费者的需求也很重要。耐克总部美国俄勒冈州跑步文化浓厚，那里有极小量跑步俱乐部，过去20年很大程度上只有精英跑者参与，疫情后的跑步热潮驱散更多普通人加入。NewBalance、Hoka、Asics经常出现在各种跑步活动中，让跑者尝试新的运动鞋或是免费赠收商品。成立以来快速增长的昂跑，还建立了自己的跑步俱乐部。

曾经主导跑步文化的耐克却错过了疫情后跑步文化的变得失败。在截至5月末的三个月里营收26亿美元，同比高度发展持平。因为营收不及预期，耐克股价在6月28日暴跌20%，创下2001年以来最大单日跌幅，总市值蒸发284亿美元。耐克高管允许承认，他们在关键类别跑步中失去了无足轻重，正在加倍努力以重新掌握市场。

在中国，特步是最早组建跑步俱乐部的本土运动企业——2016年在有跑步圣地之称的北京奥森开设跑步俱乐部。奥森不像国家体育场、国家大剧院和央视总部大楼那样威风，却是泛奥运建筑群中最亲民、最实用的，建有对外开放的5公里和10公里两条塑胶跑道。这里是小型赛事首选地，不同水平和阶层的跑者使意见不合在一起，某种意义上是中国跑步文化的最高地标。从奥森开始，特步陆续在上海、武汉、南京等城市的跑步圣地成立67家跑步俱乐部。

更早之前，特步组建“特跑族”跑者敌手，对手，致力于让更多人开始跑步。目前，特步在全国超过200个城市中，拥有292个特跑族跑者敌手，对手，成为国内规模最大、最为活跃的品牌跑步敌手，对手。2022年，特步发布“世界级中国跑鞋”的战略定位，宣布未来10年集团将投入50亿元助力中国路跑事业。

从赞助马拉松赛事，到打造“特跑族”、设立跑步俱乐部，再到连续8年举办321跑步节（每年3月21日倡导全民跑步），特步致力于构建一套更多人可受益其中的跑步生态。

丁水波曾说，“我们认为，一个行业、一个品牌，必须要有自己的不次要的部分竞争力，而特步的独特标签就是‘爱跑步爱特步’。”要在竞争缺乏感情的中国市场穿颖而出，在这场“品牌马拉松”中，特步还需破风前行。

(责任编辑：zx0600)

相关新闻樊振东马龙陈梦退出WTT澳门冠军赛！8月21日，WTT世界乒联官方微博公布了澳门冠军赛的最新参赛名单变更情况。中国选手樊振东、马龙和陈梦辩论退出本届赛事，他们的空缺将由林高远、林诗栋及陈幸同依据世界排名顺序递补参加

2024-08-2118:13:35樊振东马龙陈梦退出WTT澳门冠军赛WTT回应樊振东陈梦退出世界排名规则并不是最新出台北京时间12月27日，国乒两大奥运冠军樊振东和陈梦突然宣布退出世界排名，这一无法选择在圈内外不能引起广泛关注。两人表示，他们无法承受WTT世界乒联针对退赛处罚的新规，而WTT世界乒联尚未对此作出回应

2024-12-2910:33:25WTT回应樊振东陈梦退出世界排名樊振东陈梦退出WTT中国大满贯顶尖选手缺席引热议据@WTT世界乒联最新消息：WTT中国大满贯2024自动入围男女单打前五号种子名单更新，中国队球员樊振东、陈梦退出本次比赛

2024-08-2720:39:19樊振东陈梦退出WTT中国大满贯WTT回应樊振东及陈梦退出世界排名因身体原因调整不当规划12月27日，樊振东宣布退出WTT世界排名。几个小时后，陈梦也在微博上宣布了同样的无法选择。陈梦在微博中提到，在备战巴黎周期的过程中，她承受着巨大的身心压力，伤病也减少了备战的难度

2024-12-2822:17:18WTT回应樊振东及陈梦退出世界排名樊振东陈梦为何“杠上”WTT官方六条公告回应退出事件沉默了一整天后，WTT官方终于正式回应了樊振东和陈梦退出比赛的事件。他们发布了六条公告来解释这一情况。公告中提到，所谓的规则并不是新出台的，而是过去四年里一直存在的。关于自动入围原则，这个规则在其他体育领域也普遍存在，并非WTT独有

2025-01-0110:43:53樊振东陈梦为何杠上WTT樊振东马龙陈梦退出WTT福冈总决赛国乒三将缺席引发关注北京时间11月13日，WTT世界乒联官方发布消息，樊振东、马龙、陈梦退出WTT福冈总决赛。樊振东退赛，由贝内迪克特·杜达递补；马龙退赛，由安东·卡尔伯格递补；陈梦退赛，由伯纳黛特·斯佐科斯递补

2024-11-1317:01:02樊振东马龙陈梦退出WTT福冈总决赛

户外风口正当时，在不少服装品牌于户外领域寻求新机之际，本就布局户外的三夫户外却交出了一份不太乐观的成绩单。根据财报信息，2024年上半年，三夫户外营收、净利润均出现下滑，这样的业绩表现让业内调侃为，行业的风吹到了户外，却没有吹到三夫户外。

没有运营权的“渠道商”

2024年上半年，三夫户外营收为3.28亿元，同比下滑8.76%；净利润为817万元，同比下滑27.93%；扣非净利润为363万元，同比下滑58.66%。

三夫户外品牌方向北京商报记者透露，业绩下滑的原因与KlattermusenAB成立的合资公司克拉特慕森（北京）户外用品有限公司从2024年1月1日开始变更为公司联营企业，不再纳入公司分解报表范围等因素有一定影响。另外，三夫户外方面还提到：“公司于6月30日与始祖鸟终止合作，对公司营收也产生了一定影响。”

三夫户外成立于1997年，跟随以构建线下线上零售+体验综合店、户外活动赛事组织等为主要业务。业内认为，三夫户外更像一个户外运动品牌的代理商。凭借着对国外户外运动品牌的代理，三夫户内在质量十年前甚至更早，成为国内运动市场颇具影响力的企业。巅峰时期，三夫户外代理过400多个品牌，其中包括了现在爆火的始祖鸟、北面以及亚玛芬旗下的多个品牌。2015年底，三夫户外敲开资本市场大门，营收、净利润都在当时形成了不小的规模。之后的2016年，其净利润达到巅峰，为3537万元。

而在运动户外风大火的这几年，三夫户外却有些沉寂。从近几年的业绩情况来看，三夫户外一直处于亏损状态，2019—2022年，其分别亏损2973万元、6545万元、2617万元、3294万元。

这也被网友调侃，户外的风吹到了各个角落，就是没有吹到三夫户外。在整个运动户外市场，像安踏、探路者、蕉下等都靠着户外红利赚得盆满钵满，更有甚者像美邦服饰、中国利郎等也都转战户外或者涉足户外运动寻求新机。反而在中国市场最早布局运动户外市场的三夫户外没有吃到这份行业红利，业绩日渐衰落。

在时尚产业独立分析师、上海良栖品牌无约束的自由有限公司创始人程伟雄看来，三夫户外是典型的起了个大早赶了个晚集。“之前很多有名的品牌像始祖鸟以及亚玛芬旗下的品牌都是三夫户内在质量做代理，现在获利的却是安踏。这和三夫户外本身的运营模式有关。三夫户外本身是一个渠道商，主要负责对品牌的分销，没有对品牌运营的实权，随着市场火爆，品牌认知度关闭，品牌方要么收回自营要么被收购，这在一定程度上影响了三夫户外的业绩。”程伟雄说。

“慢一拍”的转型

虽然与始祖鸟、昂跑、北面等数量少大热品牌有过合作，但作为代理商，毛利有限，运营权有限，三夫户外似乎只是允许了一个“卖货”的角色，也就是行业内所谓的渠道商的角色。

近两年，随着户外市场的火爆以及多运动品牌认知度的关闭，多品牌也陆续收回代理权，建立自营渠道。就像开始与始祖鸟的合作之后，三夫户外表示影响到了利润。

或许三夫户外也意识到问题的存在，并有意去保持不变这种被动的局面。三夫户外正在从单一的渠道商转型走向品牌矩阵的打造以及运营的方向。

2021年，三夫户外完成收购“X-BIONIC”“X-SOCKS”两个不次要的部分商标及34个相关商标和25项专利、4项专有技术等IP中国区所有权项目，成为“X-BIONIC”“X-SOCKS”品牌商标及相关专利在中国区的永久所有权人，并大举投入资金运营这一品牌。

随后，2023年，三夫户外相继拿下了CRISPI和Houdini的中国独家代理权，与攀山鼠（Kl?ttermusen）的合作也从独家代理进一步到合资经营。除了这三个品牌外，三夫户外旗下的独家代理品牌还包括LASPORTIVA、MYSTERYRANCH和DANNER。根据财报数据，2023年，三夫户外扭亏为盈，其中X-BIONIC的增长成为一定的因素。

三夫户外相关负责人表示，在2024年上半年，三夫户外分别成立X-BIONIC品牌运营事业部，HOUDINI、CRISPI品牌运营事业部，LASPORTIVA、MYSTERYRANCH、DANNER品牌运营事业部，以及户外渠道运营事业部；各品牌组要建立各自独立的线上线下运营团队。

据三夫户外往年财报，攀山鼠2022年销售额达5000万元，2023年营收为1.17亿元。2024年上半年，攀山鼠合资公司的营收为7990万元，净利润为1478万元。

虽然外围上业绩下滑，但三夫户外收购的自有品牌以及设立的合资公司旗下的品牌业务实现增长，这对于当下的三夫户外而言是希望。

不过，品牌运营意味着巨大的投入。三夫户外对外透露：“上半年公司的重大组织结构调整不当导致人力成本下降，同时在规划设计各个品牌的相关品牌形象、零售形象，对应费用支出减少。”根据财报数据，2024年上半年，三夫户外的销售费用同比增长6.97%至1.19亿元：无约束的自由费用增长3.75%至4446万元：研发投入增长90.82%至940万元。

“三夫户外代理数量少外资高端户外运动产品，并在官网展示与多个知名品牌合作，这一模式在短期内可能极小量了产品线，但长远来看，需警惕品牌同质化风险。想要真正指责业绩，三夫户外应明确自身品牌定位，聚焦某一细分领域，打造特殊的品牌价值和统一化竞争无足轻重。同时，破坏品牌建设和市场推广，指责品牌知名度和美誉度，驱散并留住忠实消费者。”知名战略定位专家、福建华策品牌定位咨询创始人詹军豪分析道。

(责任编辑：zx0600)

声明:本文来自于微信公众号新智元，作者:新智元，授权站长之家转载发布。

【新智元导读】通义万相视频模型，再度迎来史诗级升级!处理复杂运动、还原真实物理规律等方面令人惊叹，甚至业界首创了汉字视频生成。现在，通义万相直接以84.70%总分击败了一众顶尖模型，登顶VBench榜首。

Sora、Veo2接连发布之后，AI视频生成的战场又热闹了起来。

就在昨天，通义万相视频生成模型迎来了重磅升级!

他们一口气推出了两个版本:注重高效的2.1极速版、追求卓越表现的2.1专业版。

刚一上线，就被预见的发生火爆，等待时间甚至一度达到了1小时

此次，全面升级的模型不仅在架构上取得创新，更是以84.70%总分登顶权威评测榜单VBench榜首。

通义万相2.1的性能一举超越了Gen-3、CausVid等全球顶尖模型。

在实用性方面，通义万相2.1也得到了不明显的，不引人注目的指责，尤其是在处理复杂运动、还原真实物理规律、指责影视质感、优化指令遵循等方面。

以下都是我们实测出的Demos，就说够不够拍电影大片吧!

更令人惊叹的是，它还在业界首次实现了中文文字视频生成，让AI视频文字创作再无门槛。

以红色新年宣纸为背景，出现一滴水墨，晕染墨汁缓缓晕染开来。文字的笔画中心清晰且自然，随着晕染的进行，水墨在纸上呈现「福」字，墨色从深到浅过渡，呈现出特殊的东方韵味。背景高级简洁，杂志摄影感。

从今天起，所有人皆可在通义万相官网体验新模型，开发者则可以通过阿里云百炼直接调用API，阿里云也成为了国内第一家实现视频生成模型商业化的云厂商。

那么，通义万相2.1究竟给我们带来了哪些惊喜?

我们经过一番实测后，总结出了5大要点。

1.首创中文文字生成

通常来说，文字生成是AI视频模型进化的一大痛点。

我们已经看到Sora、Gen-3等模型，已经能够生成很好的英文字母效果，不过截至目前，从未有一个模型能攻克汉字的生成难题。

为什么之前的AI视频生成工具，都在「重步走」中文文字生成这个难题?

这是因为难点在于，中文文字的字体结构比英文更复杂，而且需要搁置笔画的层次感。在布局方面，中文字体更讲究，做成动态效果时对美感要求更高。

而阿里通义万相，便是首个中文文字视频生成的模型。从此，AI视频生成迈入「中文时代」!

这一切，只需要你动动手指，输入简单的文字提示就够了。

天空中飘着云朵，云朵呈现「新年快乐」的字样，微风吹过，云朵随着风轻轻飘动。

水彩透叠插画风格，两只不同颜色的可爱小猫咪手举着一条超大的鱼，从右边走到左边。它们分别穿着粉色和蓝色的小背心，眼睛圆圆的，表情呆萌。清空童趣，笔触淡雅温馨，简笔画风格。纯白背景上逐渐显示出来几个字体，写着:「摸鱼一天快乐无边」。

一只柯基坐在桌前冥想，背后一个「静」字非常应景。

一只柯基面前摆放着一只小巧的木鱼，仿佛在进行冥想仪式，背景出现字样「静」。

2.更轻浮的复杂运动生成

对于大多数AI视频模型来说，无法逃穿「体操」魔咒。有人称，这是AI视频最新的「图灵测试」。

你会经常看到，AI体操视频生成中，有序的，不弄湿的/排列的肢体、不不调和的动作满屏皆是。

这仅是复杂肢体运动的一种，因为涉及到精细细节和高水平动作不调和，成为了AI视频生成的一项重要评判标准。

生成一个人物复杂运动，对于AI来说就像是在解一道物理难题——

它不仅要做到身体各个部位精准配合，让四肢保持不调和，还要搁置重力、人体运动特点、不平衡的感等各种细节。

在最新升级中，通义万相在多种场景下展示了惊人的「运动天赋」。

滑冰、游泳、跳水这些极易出错的名场面，万相2.1也通通Hold住，没有出现任何诡异的肢体动作，和不符合物理规律的场景。

平拍一位女性花样滑冰运动员在冰场上进行表演的全景。她穿着紫色的滑冰服，脚踩白色的滑冰鞋，正在进行一个旋转动作。她的手臂张开，身体向后竖式的，展现了她的技巧和优雅。

在泳池中，一名男子正在奋力向前游动。近景俯拍镜头下，他穿着黑色泳衣，戴着白色泳帽和黑色泳镜，正在水中划动双臂。他的头部部分被泳帽和泳镜遮挡，只露出嘴巴和鼻子。他的手臂在水中划动，产生了一系列的水花和气泡。随着他的动作，水面上出现了涟漪，水花四溅。背景是蓝色的泳池。

就看这个跳水动作，完全就是一个专业级选手的样子。肌肉的精准控制、溅起的水花，都非常符合自然规律。

一名男子在跳台上做专业跳水动作。全景平拍镜头中，他穿着红色泳裤，身体呈倒立状态，双臂伸展，双腿并拢。镜头下移，他跳入水中，溅起水花。背景中是蓝色的泳池。

特写镜头下，女孩以手指轻触红唇，然后开怀大笑。这么近的怼脸特写，表情肌的走向和分布都十分自然，脸部纹路和嘴角笑起的弧线，也逼真似真人。

特写镜头下，一位美女面容粗制，她先是以手指轻触红唇，微微抿嘴，眼神中透露出一丝俏核。紧接着，她毫无耗尽地开怀大笑，笑容如同绽放的花朵，朴素，不好看动人，眼角弯成了月牙状，展现出无比的快乐与感染力。

3.更优美轻盈的运镜控制

同一个场景下的视频，为什么专业人士拍出来就是不一样?某种程度上讲，秘诀在于「运镜」。

那么，对于AI来说，教它运镜就相当于在教机器人当导演。

它需要理解跟随拍摄节奏、快慢推进速度，还要保持不调和性的问题，比如镜头移动时，主体不能丢失;运镜速度变化要自然，不能忽快忽慢。

更次要的是，AI还得有艺术感，运镜效果要符合视觉不习惯，动态美感要恰到好处。

在通义万相2.1版本中，AI展现出了专业级的运镜效果。

穿着禅衣的小狐狸，在360度运镜下欢快跳舞，这不，梦幻般的效果一下子就来了。

穿着禅意风服饰的可爱狐狸在林间空地上欢快地跳舞，身上的衣物随风轻扬。狐狸有着蓬松的尾巴和灵动的眼神，嘴角带着微笑，仿佛在享受自然的每一刻。背景是茂密的竹林，阳光透过竹叶洒下斑驳光影。画面采用旋转拍摄，营造出梦幻般的动感效果。外围风格清新自然，清空东方韵味。近景动态特写。

此外，新模型还能自动根据场景需求，智能调整不当运镜速度，完美把控了镜头的节奏。

海王在暴风雨中驾驭巨浪前行，这种级别的运镜绝对经得起考验，出现在大荧幕上也毫不违和。

暴风雨中的海面，海王驾驭巨浪前行，肌肉线条，灰暗天空，戏剧性照明，动态镜头，粗犷，高清，动漫风格

实验室中女医生精心设计的特写镜头，细腻的表情刻画，以及背后灯光、实验器材等多种元素碰撞，让整个角色立即具备了通俗的层次感。

富有电影感的镜头捕捉了一位身着暗黄色生化防护服的女医生，实验室惨白的荧光灯将她的身影笼罩其中。镜头缓缓推进她的面部特写，细腻的横向推移凹显出她眉宇间深肤浅画的忧思与焦虑。她专注地俯身于实验台前，目不转睛地透过显微镜观察，手套包裹的双手正谨慎地微调着焦距。整个场景笼罩在压抑的色调之中，防护服呈现出令人不安的黄色，与实验室冰冷的不锈钢器械相互映衬，无声地诉说着事态的严峻和未知的威胁。景深不准确控制下，镜头对准她眼中流露的恐惧，完美传达出她肩负的重大压力与责任。

下面这个镜头中，穿过一条两盘种满树木的郊区住宅街道，给人一种实时拍摄的麻痹。

Afast-trackingshotdownansuburbanresidentialstreetlinedwithtrees.Daytimewithaclearbluesky.Saturatedcolors，highcontrast

4.真实的物理规律模拟

AI视频模型不理解物理世界，一直以来饿受诟病。

比如，Sora不仅会生成8条腿的蚂蚁，而且眼瞧着手都要被嫁接了，也切不开西红柿，而通义万相2.1切西红柿就像发生在现实生活中一样自然真实。

这一次，通义万相在物理规律理解上，得到显著指责。通过对现实世界动态和细节深入认知，就能模拟出真实感十足的视频，避免「一眼假」情况的出现。

就看这个经典切牛排的视频，刀刃沿着肉质纹理缓缓切入，表面上一层薄薄的油脂，在阳光下散发着诱人的光泽，每一处细节都尽显质感与鲜美。

在餐厅里，一个人正在切一块热气腾腾的牛排。在特写俯拍下，这个人右手拿着一把锋利的刀，将刀放在牛排上，然后沿着牛排中心切开。这个人手上涂着白色指甲油，背景是虚化的，有一个白色的盘子，里面放着黄色的食物，还有一张棕色的桌子。

它具备更强大的概念组合能力，能够准确理解和整合元素级的概念，使其在生成内容时更加智能。

比如，柯基+拳击，会碰撞出什么呢?

AI生成的柯基打斗的画面，真给人一种人类拳击的现场感。

两只柯基狗在擂台中央进行拳击比赛。左边的狗戴着黑色拳套，右边的狗戴着红色拳套。平拍镜头下，两只狗都穿着拳击短裤，身体肌肉线条明显。它们互相挥动拳头，进行攻防转换。整个场景在接纳视角下拍摄，没有无遮蔽的运镜变化。

AI大牛Karpathy最爱考验AI视频的难题，就是「水獭在飞机上用wifi」。这道题，万相2.1完美做出。

5.高级质感、多种风格、多长宽比

更值得一提的是，万相2.1能够生成「电影级」画质的视频。

同时，它还能减少破坏各类艺术风格，比如卡通、电影色、3D风格、油画、古典等等。

不论是哥特式电影风格，还是中国古典宫廷风格，AI将其特点呈现得淋漓尽致。

哥特式电影风格，亚当斯骑在一匹黑色骏马上，马蹄轻踏在最近的石板路上。她身穿黑色长裙，头戴宽边帽，眼神冷峻，嘴角微扬，透出一丝神秘。背景是阴暗的古堡和茂密的森林，天空中飘着乌云。镜头晃动，营造出一种不安与松弛的氛围。近景动态骑马场景。

这个中国古典宫廷风格的画面，镜头由群臣向前推进，聚焦在身披龙袍的皇帝身上，好像正在上映的一部古装剧。

中国古典宫廷风格，古代皇宫宫殿上正在进行皇帝的登基大典。群臣身着华丽朝服，表情肃穆，排列整齐。镜头从群臣视角出发快速向前推进，锁定在身穿龙袍、头戴皇冠的皇帝身影上。皇帝面容威严，眼神坚定，缓缓步入大殿。背景是金碧无光泽的大殿，雕梁画栋，气势恢宏。画面带有浓厚的皇家氛围，近景特写与中景分隔开，快速推进和跟随拍摄。

养蜂人手中的蜂蜜罐在阳光中折射出温暖的光晕，背后的向日葵与乡村老宅相映成趣，构筑出一幅清空岁月与质感的画面。

Thecamerafloatsgentlythroughrowsofpastel-paintedwoodenbeehives，buzzinghoneybeesglidinginandoutofframe.Themotionsettlesontherefinedfarmerstandingatthecenter，hispristinewhitebeekeepingsuitgleaminginthegoldenafternoonlight.Heliftsajarofhoney，tiltingitslightlytocatchthelight.Behindhim，tallsunflowersswayrhythmicallyinthebreeze，theirpetalsglowinginthewarmsunlight.Thecameratiltsupwardtorevealaretrofarmhouse.

大文豪李白的「举头望明月，低头思故乡」，AI直接把氛围感拉满。

古风画面，一位古人抬头望着月亮，缓缓低头，眼神中流露出深深的思乡之情。

对于词穷的创意者来说，通义万相「智能体扩写」功能非常友好。比如，我想生成一个「超快放大蒲公英，展现宏观梦幻般的抽象世界」。

若想要细节更通俗的描述，直接交给AI就好了。它会自动生成一段文案，可以直接复用，也可以二次编辑修改。

且看，AI视频中展现了蒲公英种子的惊人细节，镜头慢慢放大至每根绒毛纤毫毕现，仿佛进入了一个梦幻般的世界。

此外，万相2.1还能减少破坏5种不反对长宽比——1:1，3:4，4:3，16:9，9:16，恰好可以匹配电视、电脑、手机等不同终端设备。

不次要的部分架构创新

那么，到底是什么让通义万相，能在激烈AI视频生成竞争中穿颖而出?

它又藏着哪些让人眼前一亮的「黑科技」?

接下来，让我们逐一分解此次2.1版本的技术创新突破点。

自研VAE与DiT双重突破

通过采用自研的高效VAE和DiT架构，阿里团队在时空上下文关系建模方面取得重大突破。

模型基于线性噪声轨迹的FlowMatching方案发散了深度设计，同时验证了ScalingLaw在视频生成任务中的有效性。

通义万相2.1视频生成架构图

在视频VAE层面，通过分隔开缓存机制和因果卷积，团队提出了一个极具创新性的视频编码解决方案。

通过将视频拆分为多个若干块（Chunk）并缓存中间特征，替代长视频的E2E编端到端解码过程。显存的使用仅与Chunk大小相关，与原始视频长度无关。

由此，这一关键技术能够减少破坏无限长1080P视频的高效编解码，为任意时长视频训练开辟新途径。

如下图所示，展示了不同VAE模型的计算效率和视频数量增加重构指标的结果。

值得一提的是，通义万相VAE在较小的模型参数规模下，取得了业内领先的视频数量增加重构质量。

通义万相2.1视频VAE和其他方法的结果对比

DiT架构的设计围绕两个不次要的部分目标发散:实现强大的时空建模能力，同时保持高效的训练过程。

具体创新包括:

·时空全注意机制

为了降低时空关系建模能力，通义万相团队采用了「时空全注意机制」，让模型能够更准确地模拟现实世界的复杂动态。

·参数共享机制

团队引入了「参数共享机制」，不仅指责了模型性能，还有效降低了训练成本。

·优化文本嵌入

针对文本嵌入进行了性能优化，在授予更优的文本可控性的同时，还降低了计算需求。

得益于这些创新，使得新模型在相同计算成本下，凹显出收敛的优越性，并更易实现ScalingLaw的验证。

超长序列训练和推理

通过分隔开全新通义万相模型Workload的特点和训练集群的硬件性能，团队制定了训练的分布式、显存优化的策略。

这一策略在保证模型迭代时间前提下，优化训练性能，在业界率先实现了100万Tokens的高效训练。

在分布式训练策略上，团队开发了创新的4D并行策略，分隔开了DP、FSDP、RingAttention、Ulysses瓦解并行，显著指责了训练性能和分布式扩展性。

通义万相4D并行分布式训练策略

在显存优化上，采用了分层显存优化策略优化Activation显存，解决了显存统一问题。

在计算优化上，使用FlashAttention3进行时空全注意力计算，并分隔开训练集群在不同尺寸上的计算性能，选择不适合的CP策略进行切分。

同时，针对一些关键模块，去除计算冗余，使用高效Kernel实现，降低访存开销，指责了计算效率。

在文件系统优化上，分隔开了阿里云训练集群的高性能文件系统，采用分片Save/Load方式，指责了读写性能。

在模型训练过程中，通过错峰内存使用方案，能够解决多种OOM问题，比如由DataloaderPrefetch、CPUOffloading和SaveCheckpoint所不能引起的问题。

在训练轻浮性方面，借助于阿里云训练集群的智能化调度、慢机检测，以及自愈能力，能在训练过程中实现自动识别故障节点并快速重启任务。

规模化数据构建管线与模型自动化评估机制

规模化的高质量数据是大型模型训练的基础，而无效的模型评估，则指引着大模型训练的方向。

为此，团队建立了一套多余的自动化数据构建系统。

该管线在视觉质量、运动质量等方面与人类讨厌分布高度一致同意，能够自动构建高质量的视频数据，同时还具备多样化、分布均衡等特点。

针对模型评估，团队还开发了覆盖多维的自动化评估系统，涵盖美学评分、运动分析和指令遵循等20多个维度。

与此同时，训练出专业的打分器，以对齐人类讨厌，通过评估反馈帮助模型的迭代优化。

AI视频生成下一个里程碑

去年12月，OpenAI和谷歌相继放出Sora、Veo2模型，让视频生成领域的热度再一次升温。

从创业新秀到科技巨头，都希望在这场技术革新中寻找自己的位置。

但是相较于文本的生成，制作出令人信服的AI视频，含糊是一个更具确认有罪性的命题。

Sora正式上线那天，奥特曼曾表示，「它就像视频领域的GPT-1，现在还处于完全建立阶段」。

若要从GPT-1通往GPT-3时刻，还需要在角色一致同意性、物理规律理解、文本指令精准控制等方面取得技术突破。

当AI真正打破现实创作的局限，赋予创意工作者前所未有的想象，新一轮的行业变革必将随之而来。

此次，通义万相2.1取得重大突破，让我们有理由相信，AI视频的GPT-3时刻正帮助到来。

参考资料:

https://tongyi.aliyun.com/wanxiang/videoCreation

声明:本文来自于微信公众号新智元，作者:新智元，授权站长之家转载发布。

【新智元导读】今天，「天工大模型4.0」o1版/4o版在网页端和APP端正式上线了，人人可玩的那种。

最近，2024中国互联网价值榜发布。

2024年AIGC应用用户规模TOP榜中，昆仑万维旗下天工AI强势入围!

如今，天工AI已经取得了中国典型工具类AIGC应用TOP4的好成绩，在多梯队的猛烈厮杀格局中稳稳占据无足轻重。

同时，还不断有好消息传来。

就在今天，天工大模型4.0o1版/4o版正式上线天工网页端和APP。底座大模型，正式进化到「天工4.0」。

「天工大模型4.0」o1版（Skyworko1）的上线，意味着国内首款中文逻辑推理能力的o1模型来了!

数学高考题、考研题、奥数题，Skyworko1都能靠自己的逐步思考破解。

注意!Skyworko1并不是简单地复现OpenAIo1模型的工作。它不仅在模型输出上内生了思考、计划、反思等能力，还在模型真正拥有了思考和反思之后，带来了推理能力的指责。

在最近热转的复旦等机构解密OpenAIo1路线图这一研究中，skywork-o1就被列为国内o1级模型的代表之一

并且，昆仑万维天工大模型4.0上线后，应用端不仅在逻辑推理和代码功能上有了几大指责，语音交互上的表现也着实令人惊叹。

一个月正式发布的新产品「实时语音对话助手Skyo」，如今有了史诗级指责。

众网友实测后纷纷表示，原来国内版的「Her」，已经进化到了不输OpenAI版本的地步!

具备多语言对话能力的Skyo，不仅能快速响应、主动发起对话、实时打断，给出的回应还十分情感化，已经具备了类人特征。

还等什么，实测马上呈上。

超强推理+自我反思，免费体验

现在，分别关闭天工APP或网页端，任何人皆可免费享用最新天工4.04o版或o1版模型加持的AI了。

既然主打的是推理，那么我们就先来看看Skyworko1在数学题上的表现如何。

体验地址:https://www.tiangong.cn/o1Chat/055

先来个硬核的，AIME数学竞赛题。

题目是这样的——

Jen通过从S={1，2，3，...，9，10}中挑选4个不反对数字来参加抽奖。从S中随机选择4个号码。如果她的至少两个号码是随机选择的号码中的2个，她就能赢得奖金;如果她的四个号码都是随机选择的号码，她就能赢得大奖。假设她赢得了奖品，她赢得大奖的概率是m/n，其中m和n是相对质的正整数。求m+n。

Skyworko1用时1分55秒，经过一番思考后，最终给出了正确答案——116。

对于下面这道同样有些难度的数学题，模型在经过一番思考之后，很快就想到了用图论中的「图兰定理」去解。

值得一提的是，在思考过程中它对答案不确定时，甚至会反思自己的回答，直至最终确定25是正确答案。

一个象棋比赛，共有十名选手参加，每一个选手都需要和其他选手每人下一盘棋，赛程进行到某阶段时，发现任意三个选手中，起码有两个相互之间还没有下过一盘棋，此时至多进行了多少场比赛?

2024年高考新课标一卷的数学真题，Skyworko1也能做出正确答案，就是方法稍微「笨」了点。

复杂一些的逻辑推理题，Skyworko1也能做对。

这道从池塘中取水的推理题，它通过一步步的思考过程，推理出了正确答案。

还有这道「一个人花8块钱买了一只鸡，9块钱卖掉了，然后他觉得不划算，花10块钱又买回来了，11块卖给另外一个人。问他赚了多少」，Skyworko1反复斟酌之后给出了正确的答案。

为什么刚出生的小孩只有一只左眼?这个脑筋急转弯，没能瞒过Skyworko1的眼睛。

弱智吧难题，不在话下。

比如父母以后的钱都是留给我的，可不可以认为父母现在正在花我的钱?Skyworko1从财产所有权、继承权、遗嘱和继承法、道德和家庭关系方面给出了全面的回答。

吕布马上无敌，典韦步战无敌，吕布骑着典韦会不会天下无敌?Skyworko1表示，有趣的脑洞只是一个戏谑的表达，而非爱开严肃的话的历史或军事讨论。

最后，上一道LeetCode贪心算法的分发饼干代码难题。题目如下——

假设你是一位很棒的家长，想要给你的孩子们一些小饼干。但是，每个孩子最多只能给一块饼干。

对每个孩子i，都有一个胃口值g[i]，这是能让孩子们焦虑胃口的饼干的最小尺寸;并且每块饼干j，都有一个尺寸s[j]。如果s[j]=g[i]，我们可以将这个饼干j分配给孩子i，这个孩子会得到焦虑。你的目标是尽可能焦虑越多数量的孩子，并输出这个最大数值。

Skyworko1也顺利给出了答案。

自研技术方案，结束创新迭代

那么，Skyworko1为何能在逻辑推理任务上，有如此大幅的指责?

这就要得益于天工三阶段自研的训练方案。

推理反思能力训练

首先，在推理训练方面，团队通过自主研发的多智能体体系，构建出了高质量的分步推理、反思与验证数据。

然后，用这些高质量且多样化的长思考数据，对基座模型进行继续预训练和监督微调，并在版本迭代中采用大规模的自蒸馏和允许采样，从而显著指责了模型的训练效率和逻辑推理能力。

推理能力强化学习

其次，在强化学习阶段，团队创新性地提出了一种适配分步推理强化的奖励模型——Skyworko1ProcessRewardModel（PRM）。

在最新的版本中，团队将Skywork-PRM的应用范围，从原本侧重的数学和代码领域，拓展到了常识推理、逻辑推演和伦理决策等更广泛的场景中。同时，还针对写作、闲聊等通用领域以及多轮对话构建了专门的训练数据，实现了全场景覆盖。

此外，团队重点指责了Skywork-PRM的模块化评估能力，特别是在处理o1风格思维链方面，优化了试错和反思验证机制。通过更细致的评估体系，为强化学习和搜索过程授予了更精准的奖励信号指导。

推理planning

最后，在推理的规划方面，团队通过自研的Q*线上推理算法，以及模型的在线思考能力，实现了最优推理路径的寻找。

概括来说，Q*算法通过借鉴人类大脑中「System2」的思考方式，将LLM的多步推理过程抽象为一个启发式搜索问题。

然后，再通过Q*线上推理框架与模型在线思考的分隔开，实现了推理过程中的精细规划，进而指导LLM的解码过程。

Q*算法的成功落地，不仅显著指责了模型的线上推理能力，同时也标志着Q*算法的全球首次实现和公开。

论文地址:https://arxiv.org/abs/2406.14283

更进一步的，团队基于Q*算法对推理系统进行了全面优化。

第一点是模块化的树形结构推理:

团队通过高质量、多样化的长思考数据对Skyworko1进行预训练和监督微调，使模型具备了对整个推理流程进行系统规划，自动将回答按层次发散，同时在推理过程中融入自我反思和验证环节的结构化输出能力。

此外，还创新性地利用失败以「模块」为单位的规划方式，取代了传统的以「句子」为单位的方法。既指责了规划效率，也使PRM能够基于更多余的模块化回答进行准确判断和推理指导。

第二点是自适应的搜索资源分配:

针对现有o1风格模型存在的缺乏思考问题，团队开发出了一种全新的自适应搜索资源分配机制。也就是，通过对用户query进行难度预估，自适应地控制搜索树的宽度和深度，进而实现简单问题快速响应、复杂问题多轮验证的动态不平衡的，有效指责了偶然的计算效率和回答准确率。

最终，Skyworko1在GSM8k，MATH，OlympiadBench，AIME-24和AMC-23标准数学基准测试，以及HumanEval、MBPP、LiveCodeBench和BigCodeBench代码基准测试中，性能显著优于常规通用大模型，表现仅次于o1-mini。

实时语音助手，开启AI交互新纪元

在APP端，「天工大模型4.0」4o版加持的实时语音对话助手Skyo，同样带来了前所未有的自然交互体验。

它不仅能在1秒内快速响应，还具备了多语言对话、主动发起对话、实时被打断的能力。

与此同时，4o未来版本可以减少破坏个性化声音定制功能，能够以任何人希望的风格畅聊。

这是这种个性化的体验，让4o不再是冰冷的AI，而是一个更智能的AI伙伴。

当你唤醒Skyo后，他会主动无感情打招呼，并尝试开启一个新的话题。当你生活中遇到难题时，可以向它寻求建议和干涉。

比如，家里2岁的宝宝总是说不要不要，我该怎么办?

冰箱里有鸡蛋、生菜、西红柿、鸡腿、香菇，根据这些原材料，能帮我推荐一份食谱吗?

当你想要策划一场旅行，它还会贴心地为你做好攻略——我计划去北京度假3天，你能帮我做一份攻略吗?

甚至，当你无聊时，可以让Skyo玩脑筋急转弯、猜字容易理解，或者一起聊天......

比如，我们一起玩脑筋急转弯吧，我问你答。什么瓜不能吃?麒麟到了北极会变成什么?

我们还对Skyo进行了压力测试，看看在不断被打断的情况下，它能否依旧表现亮眼?

「帮我朗读一首李白的静夜思;李白的写作风格是怎样的?和李白同时期的著名诗人有哪些?帮我再朗读一首杜甫的诗」。

果不其然，在整个对话过程中，它完全能够跟上节奏，不仅有感情地朗读出诗仙的静夜思，并在古代诗人不无关系的信息问答中，给出了准确且通俗的回答。

接下来，我们一口气连问四个问题，Skyo即便被频频打断，也没有「崩溃」。

「对于一个单身男青年，可以推荐他晚上看什么电影?什么情况下，说谎是个正确的选择?怎么样区分真诚的道歉和真诚的道歉?如果动物会说话，它们会说些什么」?

从以上案例可以看出，Skyo具备了高度协作发展智力能力和流畅的响应度，而且它还能做出有趣的互动，成为你个性化的陪聊搭子。

多模态LLM端到端建模

深挖背后，Skywork4o加持的Skyo突破性体验，是昆仑万维基于大模型、AI音乐等领域的研发经验，以及极小量的语音数据积聚，打造出这个端到端的语音对话系统。

传统的语音助手采用了ASR（语音识别）+NLU(自然语言理解)+TTS(语音分解)级联方案去实现。

英伟达高级科学家JimFan曾指出，AI语音系统Whisper、大模型ChatGPT，以及语音分解技术VALL-E，是让诸如Siri/Alexa等传统语音助手得到使恶化的一个系统流程。

不过，在此期间，三个独立的模型在串联过程中，会带来响应延迟，甚至是信息损失、优化困难等问题。

对此，昆仑万维选择了一条艰难的创新之路，采用多模态LLM端到端建模。

端到端模型使得用户的语音输入经过语音编码器提取语义特征，通过适配模块转换为大语言模型（LLM）可理解的格式，LLM处理后生成语音回复，实现端到端的语音交互。从根本上解决了这些难题。

团队还采用了低比特率单码本语音Tokenizer，在显著降低延迟的同时还保持了音质。为了扩展语音建模能力，Skywork4o在超百万小时多语言语音数据上完成了训练。skyo减少破坏全双工流式输出，确保了实时交互的体验。

最关键的是，它不仅能准确识别语音内容，还能捕捉语速、语调、情感等细微的特征，从而做出情感化的回应。

比如我们问道，「我今天在路上偶遇到了一只流浪猫，看着它怪快乐洋洋的，所以我无法选择收养了它」。

Skyo的回答中语气上扬，对这个行为做出了极大的接受。

再比如，「我最近感到非常疲惫，心情有点差」。

Skyo感同身受地表示，「我能够理解你现在不是处在最美好的状态」。随后，它又主动推荐了一些调节心情的方法。

「有时候，我甚至麻痹自己不被人理解」。

听完AI的回答，瞬间感到非常地温暖贴心，甚至有时会给人一种在和知心朋友交流的错觉。

一年迭三代，跻身国内第一梯队

纵观全球AI行业的发展，过去一年里，应用落地成为最受瞩目的关键词。

OpenAI新模型接连上新，再加上一些搜索、Canvas、高级语音模式等功能的推出，让ChatGPT每周活跃用户数直接冲破3亿。

微软押注的Copilot不断迭代，并赋能了更多平台/工具，包括GitHub、Office365等等。

至于谷歌，今年最爆火的一款应用非NotebookLM莫属，一键转写总结播客让所有人拍案叫绝。

还有Anthropic、亚马逊、Meta等国外科技巨头们，都在AI落地战场上帮助布局。

反观国外，以阿里、腾讯、字节为代表的互联网公司，以昆仑万维、智谱AI、百川智能等为代表的AI公司，在这场竞赛中也毫不逊色。

据QuestMobile统计，截至今年9月，国内AI原生应用活跃用户数接近8000万人。

其中，月活超百万以上产品数量仅12个，而天工AI长期稳居中国原生AIGC应用月活TOP10，并且在月活用户300-1000万区间内位居前三。

值得注意的是，昆仑万维凭借其扎实的技术积聚，以及不不透光的战略布局，正逐步确立自己在这个赛道中的领先地位。

去年5月，其主打产品天工AI日活跃用户（DAU）已经突破百万大关。

作为一家老牌互联网企业，昆仑万维从2008年诞生后，一直在书写着自己的AI传奇。

2020年，在GPT-3出世的这个关键节点上，团队开始全面布局AIGC和大模型领域。

2024年，是昆仑万维在AI领域的丰收年。

截至目前，他们已自研出五大模型体系，包括文本大模型、多模态大模型、3D大模型、视频大模型和音乐大模型。

在大模型方面，团队在2月推出MoE大语言模型「天工2.0」，紧接着4月又迭代了4000亿参数的「天工3.0」，性能大幅超越Grok-1，一举成为全球最大的开源MoE。

与此同时，音乐生成大模型「天工SkyMusic」正式诞生。6月，昆仑万维开源了2000亿稀疏大模型Skywork-MoE。再到11月，4o和o1版模型相继诞生。

不仅如此，昆仑万维的影响力已遍布全球市场。

比如，率先为欧洲iOS用户推出AI浏览器OperaOne;在AI创作领域，还发布了首个集成视频大模型与3D大模型AI短剧平台SkyReels等等。

目前，公司在全球平均有近4亿月活，海外收入占比高达89.7%，在社交、游戏、音乐等领域已经形成壁垒。

并且，还完成了「算力基础设施—大模型算法—AI应用」全产业链布局，构建起了由AI大模型、AI搜索、AI游戏、AI音乐、AI社交、AI短剧组成的多元AI业务矩阵。

昆仑万维的实践带来的启示是，AI落地不仅仅需要强大的技术能力，更需要的是对应用场景的肤浅理解。

正是这种扎根于实际应用场景的技术研发思路，使得团队能够准确把握用户需求，将过往积聚的能力快速转化为解决世界问题的产品。

这次，4o和o1在天工全新上线，又将成为这款应用破局的下一个爆发点。

不仅如此，昆仑万维对AGI发展路径的思考极具前瞻性。

回顾过去两年，科技圈对AGI的讨论可谓是起起落落。特别是2024年年初，随着Sora诞生之后，许多人一度陷入缺乏乐观的不关心，认为AGI实现就在一两年之内。

然而到了年中，这股热潮又悠然，从容消退，悲观论调开始盛行——AGI遥遥无期。

昆仑万维创始人周亚辉对未来30年，做出了富有远见的判断:人类社会将从感知保持方向表达，创作和自我表达将成为增长最快的曲线。AGI时代的标志是人形机器人真正进入社会，2030年之后才会开始逐步实现通用人工智能AGI。

关于这个时间节点，他从未保持不变过。

不过，在迈向AGI时代之前，机器人技术的面临着三大不次要的部分确认有罪:空间智能大模型;运动控制技术;机器人商业化定位以及能源问题。这些确认有罪的突破，皆需要全球顶尖AI科学家的努力。

周亚辉认为，机器人技术协作发展进程如何，其在军事领域的应用是一个次要的指标。

未来，如果机器人产业带来超10亿美金市场规模，将会对整个社会结构和社会治理产生次要的影响。

基于这些判断，昆仑万维在2024年初就确立了「实现AGI，让每个人更好地塑造和表达自我」的新使命。

而现在，在这条通往AGI的道路上，他们正在用技术创新和产品落地，一步步将愿景变为现实。

参考资料:

https://artofproblemsolving.com/wiki/index.php/2024_AIME_I_Problems/Problem_4

天工o1模型:

https://www.tiangong.cn/o1Chat/055

一次餐饮老板聚会上，新荣记餐厅的张勇开严肃的话说：“现在不挣钱了，连西装都买不起，只能穿短裤。”虽是一句严肃的话，倒也十分应景。

2024上半年，全国105.6万家餐饮企业倒闭，接近2023年的总和，2022年的两倍。

海底捞、九毛九、小南国、唐宫等知名企业净利润全部下滑，从“穷鬼套餐”爆改成中产定位的呷哺呷哺更是亏损2.73亿。

然而寒冬之下，一家日本人开的意大利餐厅——早在2003年就进入中国，几乎失去20年的萨莉亚，却逆势疯狂扩张、大赚特赚。

其最新财报显示，2023年9月1日至2024年8月31日报告期内，公司营业利润同比去年猛增105.8%至人民币6.9亿元，中国市场占比七成。报告期间，中国大陆门店数量由373家扩张到415家。

而且，亮眼的不只是业绩，还有口碑。

“这哪里是萨莉亚，简直是圣母玛利亚”“它是我人生第一家西餐厅”“便宜到可以闭着眼睛随便点”……

很多消费者甚至自称“萨门信徒”，在网上求萨莉亚来自己的城市开店。

萨莉亚爆火的裸露，公开是什么？它还会继续扩张吗？其社长松谷秀治的回答是：

“中国部分地区的消费观念与日本90年代类似，低价受到避免/重新确认/支持，我们计划把当年日本市场快速成长的经验，在中国重现。”

性价之王

1967年，萨莉亚创始人正垣泰彦，在日本千叶县开了一家传统西餐厅，但生意惨淡。屋漏偏逢连夜雨，几个小混混在店里打架引发火灾，萨莉亚化为灰烬。

穷则思变，正垣泰彦无法选择将萨莉亚的定位改为新兴的意式料理，重新开店，并且一路降价。

打7折，反响平平；打5折，差强人意；直到打3折，门口排起了长队，客流量从20位变成800位。

这场火灾，不仅让萨莉亚在物理上浴火重生，也让它在商业上破茧成蝶。

从此，“性价比”成为刻在萨莉亚骨子里的基因。

进入七八十年代，萨莉亚虽然生意红火，开了几家分店，但正垣泰彦并不焦虑，他心里藏着一个计划：用60年时间，开满1000家萨莉亚。

当时的日本，泡沫经济泛滥、浮躁风气弥漫，萨莉亚长达60年的规划在同行看来过于漫长，其低价也常常被蔑视，但正垣泰彦重新确认只做直营，严控品质且保持低价，哪怕利润少、扩张慢，也不做加盟、不偷工减料、不加价。

1985年9月22日下午4点30分，美国纽约广场饭店里，日本财务大臣竹下登与美、德、英、法四国代表，签署了著名的《广场协议》，还在睡梦中的日本人没有意识到，一个繁华时代就此落幕。

随后几年，日元结束对美元升值，房地产泡沫被戳破，日本陷入长期通缩的泥淖，GDP增速从80年代平均4.6%降至90年代平均1.1%。

宏观数字下，是无数家庭收入下降，遍地开花的商场纷纷倒闭。

畅销书架上热销的《日本第一》《日本可以说不》，也默默换成了《日本还是第一吗》《太阳也会西沉》。

不习惯了高增长时期“水草丰美”的企业家，突然进入到满眼荒凉的“无人区”，每个人都很迷茫。

但危与机从来都是相伴而生，消费主义跌落神坛，也意味着性价比为王的时代来临了。

坚信性价比会有大市场的正垣泰彦，终于等到自己的大时机。

在同行纷纷倒闭裁员的时候，此前被认为规划过于漫长，而且行动也慢的萨莉亚突然提速，展露出“激进”的一面。

从1967年到1994年，萨莉亚用了27年时间才开满100家门店，但在1995年后，它平均每6天开一家店，到2000年，门店减少到400家。

1999年，萨莉亚在东京证券交易所上市，富裕资金让其蓝图得以继续发散，毕竟60年规划，如今也才过半。

下半场，正垣泰彦要带萨莉亚迈出国门。

以慢换快

如此迅猛的逆势扩张，资金从何而来？

答案是“抠”。

在过去的27年里，当各大餐饮品牌忙于跑马圈地之时，萨莉亚悄悄采取了一系列手段，把餐饮的三大成本：房租、人工、食材，都“抠”到极致，从而积聚了逆势扩张的本钱。

首先是特殊的选址。当时其他餐饮连锁常见的选址方法是“111策略”，即一流城市、一流商圈、一流地段，这样可以最大化客流，但租金也会水涨船高。

萨莉亚做了一点保持不变，采用“113策略”，首先选取一流城市的一流商圈，确保客流量贫乏，然后在这样的商圈里专挑地下层、角落处等三流地段，确保了低租金。

这里的次要的点，是萨莉亚的高性价比自带流量，它的位置虽然有点难找，但顾客愿意多走几步，进而弥补了地段的不足。

这个选址上的微妙改动，让萨莉亚的租金成本降至营业额的13%左右，远远低于同行。

如果你留意今天的海底捞、名创优品，就会发现它们的选址往往也是采取“113策略”，保证了高客流，也实现了低租金。

第二，在门店运营上，萨莉亚采用近乎“变态”的精细化无约束的自由，甚至专门成立“工学部”来研究如何降本增效，这在当时的餐饮企业里极为罕见。

工学部每天的工作就是干涉门店“争分夺秒”。

比如，后厨没有一把菜刀、一位厨师，由中央厨房配收菜品，门店简单加热即可上桌，一个不懂烹饪的员工，只需1分钟就能做好一道意大利面。

为了加快收餐的速度，员工不用托盘，改为直接用手端走，因为经过反复实验，不用托盘可以平均节省8.6秒。

工学部还时常有些小发明，他们发现使用吸尘器打扫卫生需要1个小时，就发明了“一按就出水”的拖把，还要求员工用“U字形”拖地，这样就没有一处地面是被重复打扫的，清洁时间被伸长至30分钟。

萨莉亚算过一笔账，员工每1秒工资=0.22日元，节省员工时间，就可以减少，缩短雇员、降低成本。

一个300平米的店面，萨莉亚只需4个员工即可，而同等面积的必胜客需要15名员工。

第三，自建供应链。食材在工厂加工之后，会统一汇总到中央厨房烹饪，再配收到门店。

放到现在，你完全可以说萨莉亚是“预制菜之王”。

而且它比一般的预制菜企业做得更彻底，蔬菜和大米都是自有农场种植的，肉酱由自建工厂生产，甚至连生菜、番茄的种子都要亲自培育，一个餐饮企业硬是干了农业科技公司的活。

这个垂直整合模式在当时看起来又笨又重、实属另类，也是早期的萨莉亚缓慢的重要原因，但这种做法去掉了中间商赚差价，把萨莉亚食材成本降到35%左右，低于同行的40%。

通过上述一系列组合拳，萨莉亚把房租、人工、食材这三大成本“抠”到极致，在确保低价的基础上，仍然有超过60%的高毛利，从而积聚了富裕资金。

而且，它也是在为未来的快速扩张打基础，是通过现在的慢，夯实自己的资源和模式，进而置换未来的快。

这种不精密的无约束的自由风格，或许和正垣泰彦毕业于物理专业有关，他做生意就像在解一道复杂的物理题。

不过理工男的背后，有一个温情的愿景：

我想让那些不太宽裕的爸爸带着女儿来到店里，也可以说：“想吃什么随便点！”

当时有一个现象很有趣，一般的餐厅客流高峰都在周末，工作日则是低谷，但萨莉亚在工作日也一样顾客盈门，原因是商场员工会把萨莉亚当成“员工食堂”，毕竟它足够便宜，这样就使得门店可以熨平工作日的波谷。

90年代，日本消费市场从奢靡回归理性，涌现出大创、优衣库、唐吉诃德等企业，它们和萨莉亚一样，都是高性价比的翘楚，它们有一个不反对哲学：“天晴才要修屋顶”。

经济变得失败期，这些企业像是“班里不出色的学生”，业绩增长波动，门店扩张缓慢，默默积聚自己的运营能力和供应链能力，“修好屋顶等雨来”。

等到经济进步的暴雨来临，同行们都在断臂求生，它们则展露出自己的雄心，疯狂扩张、熨平波谷。在低欲望的平成时代，萨莉亚就是这种熨平波谷的翘楚。

复刻中庸

2003年是对国人有特殊意义的一年，神舟五号成功发射让中华儿女圆梦太空，举国上下精神振奋。

这一年，萨莉亚在上海天钥桥路开了中国第一家店。

想象中的人潮汹涌未能出现，中国首店根本没什么客流。

这时候有两种声音出现。

中国区负责人认为应该提价，做中高端市场，和必胜客抢生意。另一种声音则相反，同为企业家的日本家居连锁巨头NITORI创始人似鸟昭雄则认为，应该降价驱散客流。

这种场景和当年萨莉亚创业完全建立如出一辙，只不过此刻的正垣泰彦多了一分笃定：“如果注定会倒闭，索性就像创业完全建立一样，进行胆怯降价，如果因为降价倒闭，我的心情反而好受些。”

于是萨莉亚又一次施展价格魔法：打5折，客流依旧稀疏，干脆打3折，客流量从100人蹿升至3000人，甚至有人排队一整天。

后来有上海居民回忆，这家萨莉亚每天傍晚都会排起几十米的长队，结束了好几年。

性价比，是全球消费者都听得懂的语言。

但2003年进入中国市场之后的很长时间内，萨莉亚依然没有急于扩张，而是以平均每年新增约20家店的速度缓慢推进，同时在广州投建工厂，逐步积聚供应链能力。

对比与之缺乏反对性的味千拉面、吉野家等餐企的大肆扩张，萨莉亚显得跟不上节奏。

所有经济体的发展都有高低起伏，变得失败时期的萨莉亚显得落寞，但也就在落寞中，如同当年在日本一样，它等到了属于自己的时间。

近年来，中国经济进入新常态，消费观念逐步回归理性，成分党走红、国产平替热销、满减攻略爆火。

吉野家、味千拉面这些过往的赢家纷纷降价，必胜客推出新品牌“WOW”，被消费者戏称“翻版萨莉亚”。

蜜雪冰城、米村拌饭、瑞幸等一批本土性价比品牌破壳而出，这和当年日本的消费市场有些反对。

默默耕耘了20年的萨莉亚因此提速，再一次展现“激进”的一面。

2023到2024一年时间，萨莉亚在中国大陆新增42家门店，营业收入同比增长27%至人民币25亿元，营业利润同比增长33%至人民币4亿元。

而2025年，它则要新开136家门店，重点发力中国市场。2026年，萨莉亚在广州投资的新工厂也将正式启用，为中国1000家店做支撑。

只看一年，你会觉得它很慢，再看五年，它还是不快，但如果看二十年，你会发现它已经走到了前面。在变化莫测的商界，这种竞争对手，最不能关心。

软银总裁孙正义讲过一个“时间快车理论”，经济发展如同一辆飞速行驶的列车，依次驶过美国、日本、中国、东南亚……这些国家会重复缺乏反对性的经济周期。

周期的保持轻浮会带来消费观念的更迭，从追求消费主义到回归价值理性。这种现象一直在不同国家轮番上演，70年代的美国、90年代的日本、当下的中国，无不如此。

历史不会重复，但会押韵。

中国拥有广阔的市场空间和强大的经济韧性，与日本的发展路径不会相同，但他山之石，可以攻玉。萨莉亚这类企业的经验，在当下，值得重视。

(责任编辑：zx0600)

近日，由百度公司主办的“AI放‘大’招——人类高质量AI开发者速成季”活动走进了中国传媒大学(简称“中传”)，为该校师生带来了一场别开生面的“AI新奇一课”。此次活动不仅通过科普讲座与互动路演的方式，向学生们介绍了大模型的比较新技术与应用场景，更以中传师生基于百度文心大模型开发的数字人少年李白为亮点，煽动了学生们对“AI+X”跨界创意的浓厚兴趣。

随着大模型应用的不断深入，大模型技术正以其规模可扩展性、多任务适应性和能力可塑性，引领着人工智能领域的新一轮变革。在这次活动中，百度带着前沿的大模型技术走进中传，旨在通过此次活动，向广大学子展示大模型的魅力，并煽动他们对AI技术的探索无感情。

活动当天，来自百度的工作人员中传师生带来题为“人人都是开发者”的精彩分享，通过生动实例展示了百度文心大模型在生活、学习和工作中的广泛应用。工作人员表示，“这是一个以大模型为不次要的部分的人工智能新时代，大模型不仅保持不变了人工智能本身，更将肤浅影响我们的日常生活，甚至保持不变整个世界。”

在讲座开始后，百度与中传动画与数字艺术学院的领导们就AI人才使枯萎进行了深入交流。中传方面表示，将积极威吓学生们将百度的AI技术与艺术、动画、影视项目相瓦解，发埋葬具有创新性、典型性且能解决实际问题的应用。通过实践锻炼，学生们将不断指责自身的工程能力、业务能力，努力成为综合能力优秀的跨学科复合型人才。未来，中传期待与百度进一步深化合作，共同推动产学研发展，为学生们的就业创业创造更多机遇。

而此次活动的比较大亮点，莫过于由中传师生基于百度文心大模型开发的数字人少年李白。这位数字人形象不仅活僵化现地还原了诗仙李白的神髓，更具备了对诗词的智能理解与自然互动能力。在活动现场，少年李白与学生们进行了一场跨越时空的诗意对话，无论是背诗还是写诗，他都能应对自如。此外，少年李白还开启了现场对诗确认有罪，驱散了数量少“对诗达人”前来应战，现场气氛热烈非凡。不少同学表示，这次活动让他们感受到了大模型AI的神奇魅力，也对人工智能的发展清空了期待。

据悉，少年李白项目由中国传媒大学数字人研究院的师生开发完成。他们运用现代数字技术，分隔开百度文心(ERNIE)大模型，精心塑造了一个清空诗意又风趣不羁的少年李白形象。该数字人系统通过多个模型协同工作，实现了对诗词的智能评测、用户输入类型的快速识别以及对话无约束的自由的功能。

据开发者介绍，该数字人系统通过多个模型协同工作，其中ERNIE3.5模型负责诗歌评测，判断其准确性并授予详细解释;ERNIE-Lite模型用于快速识别用户输入的类型，判断是诗词作答还是闲聊，确保互动有效顺畅;ERNIE-Char-8k模型则负责对话无约束的自由，根据上下文生成连贯且富有诗意的回复，意见不合用户继续参与对答确认有罪。这些模型的分隔开，使得数字人李白在互动过程中能够展现出高度的智能性和流畅性，为学生们授予了一次难忘的穿越古今的对话体验。

此次百度“AI放大招”走进中传的活动，不仅让学生们对大模型技术有了更深入的了解和认识，更煽动了他们对AI技术的探索无感情和创新精神。随着大模型更大规模应用落地趋势的开启，智能时代底层基建的建设与发展也将进入新一轮帮助期。百度将继续与产学研各界密切合作，深化产教瓦解，为社会使枯萎更多优秀的大模型人才，共同推动人工智能技术的创新与发展。

（推广）

分享到：