一家朴实的机器人公司成长史。

定焦One(dingjiaoone)原创

作者 | 王璐 贺树龙

编辑 | 魏佳

2026年春晚后台,演员沈腾走进拍摄现场的那一刻,银河通用的机器人就必须立刻开始工作。

没有彩排,没有走台,没有NG的机会。一个多小时的拍摄窗口,一次性完成。

比春晚更早的一次考验,发生在一场面向投资人的闭门演示中。机器人在执行取放高脚杯的指令时,因抓夹微松、杯腿纤细,杯子意外滑落摔碎。然而,机器人并未停滞或报错,而是自主清理起地上的玻璃碎片。

这一举动完全超出预设,让在场所有人意外。“这不是脚本,是模型自身的闭环判断力。”银河通用首席战略官赵于莉回忆道。这个意外后来被写进了春晚节目,也成为银河通用对外讲述技术实力时最常提起的故事之一。

成立不到三年,估值突破210亿元,银河通用如今已经是国内估值最高的具身智能公司之一。但与行业里那些会连续后空翻、跳街舞的明星机器人相比,银河通用的产品看起来有些“朴素”,轮式底盘,没有酷炫的双足行走,甚至连春晚总导演第一次看到它时都觉得它“太务实了”。

赵于莉不回避这个评价。在她看来,银河通用要做的,是一个“能干活”的机器人。近日,「定焦One」与赵于莉进行对话,探讨了这家公司的技术逻辑与商业选择。

01.从“流量战场”到“数据无人区”

赵于莉的职业履历横跨互联网行业近二十年。

从清华硕士毕业后,她先进入麦肯锡,建立起战略分析的全局视野;随后加入奇虎360,参与了从战略规划到业务落地的整个过程;之后在游族网络,带领团队完成了从产品研发到市场发行的全链条实践。从PC互联网到移动时代,从流量经营到内容深耕,她都深度参与。

但熟悉感带来了另一种困境。“原有经验成了双刃剑,业务探索的兴奋感在递减。”她对「定焦One」表示。当互联网业务模式逐渐定型,她开始寻找一条能持续学习、并能参与塑造的新赛道。

当时,具身智能正在经历一轮快速发展。2024年,美国明星机器人公司Figure AI与OpenAI宣布合作,主要目的在于将大语言模型能力注入人形机器人,这一联盟吸引了包括微软、英伟达、亚马逊在内的巨头公司,Figure更是在最新一轮融资中估值接近400亿美元。

国内更是动作频频。七部门联合发布《关于推动未来产业创新发展的实施意见》,明确将人形机器人列为创新标志性产品。近两年,全球人形机器人行业融资事件密集,这条赛道正以前所未有的速度升温。

但她没有冲动入场。在正式加入银河通用这家2023年才成立的新公司之前,她花了大量时间做行业调研。

赵于莉说,银河通用最终打动她的是三个判断:技术在全球领先、商业理念务实、团队兼具学术深度和产业经验。

这些特质,在两位核心创始人身上得到了集中体现。赵于莉与银河通用机器人创始人兼首席技术官王鹤师出同门,都毕业于清华大学。这位年轻的学弟、如今的北大研究员,在斯坦福攻读博士期间便早早锁定了具身智能方向,2016年开始在此领域深耕,属于国内极少数的“原生”研究者。

联合创始人姚腾洲及其带领的硬件团队,则补全了拼图的另一半。他拥有多年的机器人创业与产品化经验,其上一代机器人产品累计出货产值达数亿元级别,深刻了解从实验室原型到稳定可靠产品之间该如何跨越。

赵于莉回忆当时的感受,“这家公司不是一个纯学院派的构想,也不是一个仅凭工程经验在既有路径上迭代的团队。他们真的在尝试解决一些本质问题,而不仅仅是做一个演示。”

2025年中关村论坛上,近100家机器人公司带着产品到场,热闹非凡,赵于莉在现场逐一观察,发现许多炫酷的演示背后,依然离不开人工的暗中辅助或频繁重置。而银河通用的展台是少数例外,其机器人在无人干预的情况下,连续五天承担了引导与商品售卖的工作,这种稳定感和实用性,在展会中颇为突出。

“在这家公司,我常常感到知识焦虑。”赵于莉说,“公司团队里博士比例很高,讨论技术细节时,我得打起十二分精神。但这恰恰是魅力所在,你不是在重复过去,而是在和一群最聪明的人,共同开垦一片名为物理智能的处女地。”

具身智能行业的核心瓶颈,是数据。赵于莉用一个对比来解释:ChatGPT之所以能横空出世,是因为互联网上有海量的文本数据可供训练。但机器人需要的是物理世界的操作数据——怎么抓取一瓶水、怎么搬运一个箱子、怎么在货架上精准取出一包方便面,这些数据在互联网上完全没有,无法免费获得。这就是赵于莉所说的“数据无人区”。

行业的主流解法是“人工喂养”,比如特斯拉雇佣数百名操作员,通过遥控机械臂,一遍遍演示“抓取电池”这一动作,生成供机器人模仿的数据。这种方法简单直接,但代价高昂、效率低下,且难以规模化到成千上万种任务。

因此,银河通用选择了另一条技术路径:合成仿真数据。在虚拟世界中重建物理规律,生成高质量的仿真数据。

02.一家“朴实”的机器人公司

合成仿真数据,可以简单理解为,在电脑里搭建虚拟场景,让机器人无限次训练,零成本、高效率。关键难点在于,虚拟训练出来的能力能否迁移到真实世界。

“如果仿真数据只是看起来像,那毫无意义。”赵于莉说,“早期的仿真,就像在玩一个画面精美的电子游戏。你可以在游戏里轻松抓起一个水杯,但这个水杯没有真实的质量、摩擦力、形变反馈,因此用这一数据训练出的机器人,在现实里可能连一张纸都抓不稳。”

“合成仿真数据,行业里很多人不认可,觉得没法用。”赵于莉表示,问题在于大多数团队还没突破从仿真到真实物理世界之间的技术桥梁。这座桥梁的核心,是对物理反馈的深度理解。需要深度融合计算机图形学、物理仿真、物理渲染和自动动作合成管线,包括验证闭环的一系列全套基建,因此技术壁垒高,研发周期长。

尽管合成数据是训练的起点和主体,但银河通用的技术路径并非完全排斥真实世界,而是“仿真预训练+真实数据强化优化“,最初以99%合成数据+1%真实数据的极端比例起步,赵于莉透露,随着正式业务落地数量的增加,其真实数据占比正在逐步上升。

这条技术路径带来了一些令人印象深刻的成果。

2025年初,银河通用发布了全球首个端到端具身抓取基础大模型(GraspVLA),无需任何真实世界数据标注与训练,仅凭虚拟世界的学习,机器人就能在现实中抓取各种未见过的、透明的、反光的、柔软易变形的物体,成功率达到95%。

而最新技术“银河星脑”(AstraBrain)是全球首个集成“大脑-小脑-神经控制”于一模的全身全手端到端具身大模型,打通从多模态感知到实时反馈控制的全链路。

其能力的极致体现之一,是旋转纸皮核桃。为了让灵巧手掌握这类对力度控制要求极高的精细操作,研发团队会先在仿真平台上进行海量预训练,建立基础策略,然后再在现实世界中采集少量真实交互数据,对模型进行微调与强化学习,让机器人学会精准拿捏“紧一点会碎,松一点会滑”的巧劲儿。

在具身智能行业,“秀肌肉”是最容易获得关注的方式。机器人跳舞、翻跟头、打太极,这些动作天然具有传播力。赵于莉也承认,去看一场体育比赛肯定比看一场奥数比赛更直观,这是人之常情。但银河通用的选择是:让机器人下场干活。

这个选择首先体现在产品形态上。银河通用为它的首款商用机器人Galbot G1,装上轮子。

“这不是成本问题,是‘生存’问题。”赵于莉解释,“双足动态平衡能耗巨大,站着不动都在‘烧钱’。对于需要24小时不间断工作的工厂等场景来说,无法接受机器人每两小时就回充电桩休息。轮式底盘是当前技术下实现可持续生产力的最优解。”银河通用在2024年联合美团开设的第一家智慧药仓,机器人已经7×24小时工作超过一年,中间几乎没有维修。

这种“生产力优先”的逻辑,贯穿了其所有商业决策。他们盯上的,是最枯燥、最重复的“脏活累活”。

在商业落地上,银河通用目前聚焦工业制造和智慧零售两大场景。

在工业领域,从汽车巨头宁德时代、博世的产线,到消费电子工厂的质检工位,Galbot机器人正在完成上下料、分拣、搬运等任务,部署量已达千台级。2026年初推出的重载型号S1,能自主搬运50公斤的物料,在真实车间里已连续运行数月。

在零售方向,他们打造了银河太空舱,这是一个以机器人为核心的智能零售终端。它在中关村、颐和园、北京王府井、成都春熙路等核心商圈为游客提供饮料,已在全国20多个城市快速落地超100个点位,并为所在商场带来了平均30%的客流提升。

“连今年春晚的导演第一次看到我们的机器人,都说太朴实了,能不能让它看起来更炫一点?”赵于莉笑道,“我们展示的不是花哨,是它能稳稳抓住一个透明杯子的真本事。这就是我们的底色,让技术在现实世界中产生看得见的效用。”

03、谁是中国具身智能领域的“特斯拉”?

2025年3月,宇树科技递交招股书,成为具身智能行业的一面镜子。

有两个数据引起了赵于莉的注意,一是宇树高达60%的毛利率,展现了其在运动控制与硬件成本上的极致能力;二是其约7.7%的研发费用率,这个比例在行业里算偏低,展示出“控制优先”路径的效率。

她分析,这与宇树的发展路径有关。宇树创始人自己手搓机器人出身,对零部件的成本控制做到了极致;同时,在运动控制这条路上,他们确实做到了世界级。

但她也指出,银河通用与宇树的基因和赛道有根本区别。

“银河通用更像一家AI公司,我们的研发投入高度聚焦于‘大脑’,也就是具身智能大模型本身。”赵于莉表示,这种差异也延伸至商业化上,宇树的部分机器人凭借其运动能力,服务于表演、科研等场景;而银河通用押注的,是工业与零售等“生产性场景”。

工业应用起步很慢,每个工厂、每条产线都需要深度定制。但魅力在于,当处理过的场景足够丰富、能力边界不断拓宽,形成的将是深厚的场景壁垒和可复制的规模效应。赵于莉认为,这种差异或许正是资本市场看中银河通用的原因,投资人赌的不仅是机器人,更是其通用AI能力在广阔物理世界中的应用潜力。

谈及中美竞争,赵于莉有一个清晰的判断,在具身智能的工程化与商业闭环层面,中国和美国的差距不大。“我们的银河太空舱落地四个月后,特斯拉才推出功能相对单一的机器人零售店。至少在解决实际问题和实现商业闭环这条路上,中国公司并没有落后。”

但她也观察到了中美公司之间的另一面差距:讲故事的能力。

“比亚迪的收入和利润规模都已经超过特斯拉,但市值没有特斯拉高。特斯拉讲述的是能源革命、移民火星的宏大未来;比亚迪更聚焦于展示销量数据和具体技术。在机器人领域,美国Figure AI描绘的是家用机器人包揽一切家务的未来图景;而中国公司,包括我们,更习惯于展示工厂里的故障率、仓库里的拣选效率、零售点的ROI(投资回报率)数据。”

中国公司更加务实,但在叙事能力上偏朴素了一些。

如今Figure AI的估值倍数远高于国内同行,她认为在技术相当甚至商业落地更快的当下,中国硬科技公司在资本市场上应该拿到更高的估值。

当被问及“谁会成为具身智能领域中国的特斯拉”时,赵于莉的回答是:“我们觉得自己有责任去争取这个位置。”她随即补充道,上市是获取资源、加速奔向那个未来的方式之一,但绝非终点本身。“真正的考验始终是,能否将技术持续转化为用户认可的价值。”

在她对未来的构想中,终极的机器人产品应该像今天一些优秀的AI应用一样,成为生活中一种自然、无感的存在。“用户无需知道背后是哪个模型,只需提出需求,它便能理解并完成。这才是技术应该实现的终点,它不再是一个需要被‘展示’的工具,而是如同水电一样成为基础设施。”

在这场对话的前一天,赵于莉还工作至凌晨两点。银河通用整个公司约有五百人,其中大部分拥有博士或顶尖高校背景,“有事即应,使命必达”是这群人的常态。他们聚集于此,不是为了重复互联网的流量游戏,而是为了一个更务实、也更坚实的梦想。

当下,机器人行业站在岔路口,一边是凭借运动能力吸引全球目光的“明星”,另一边是走进厂房、仓库,开始创造价值的“员工”。银河通用选择了后者。这条路或许缺少掌声与光环,但它所指向的是一个更扎实、也更接近真实的未来。