正在中国,环卫是一个规模复杂、痛点凸起的行业:劳动稠密、招工坚苦、平安风险高、功课尺度严苛。但也刚巧由于如许,并不的环卫场景才可以或许权衡其智能价值。
廖文龙总结:“简单来说,我们的架构能够归纳综合为World Action Model(世界动做模子)+ VLM(视觉言语模子)。”!
家用洁净是懒人经济的成果,是锦上添花的需求;而环卫功课属于城市运转底层逻辑,是必需完成的使命。比拟工业机械人流水线,环卫机械人的需求更为火急和现实——功课艰辛、风险高,因而岗亭持久存正在招工难和人员流失问题。但城市的根本卫生又容不得缺席。
如许的表现正在酷哇以BEV World Model为基座的手艺线中。它通过海量数据预锻炼,能预测恍惚的将来形态,并间接解码出Action(动做)。这种能力雷同“曲觉”:风吹动垃圾,它晓得垃圾可能会漂到哪;取墙靠太近,它大白撞上去会带来后果;口通行,它评估对方的企图取潜正在风险。这让系统脱节了以往先建图、再规划、再节制的工程逻辑堆砌的。
环卫场景是现阶段具身智能的落地标的目的中,同时也是门槛最高的疆场。它一方面具备高频、刚需付费的典型ToB 特征,适合用 ROI 贸易价值;另一方面,也天然包含了这一代Physical AI最难绕开的四道关,而能打通这四道关的公司百里挑一,形成了天然的手艺壁垒。
酷哇曾经看到这一片增量市场。本年推出的小型机械人R0,就是对这一难点的回覆——采用轮脚式布局,半人形,具备双臂操做能力,能够正在更复杂、更狭小的中展开工做。目前,“R0”曾经能够进行捡拾功课的测试,酷哇的规划是,R0能正在短期内处理操做泛化问题,将来进入物业办事范畴,实现一机多能,既能ToB又能ToC。
酷哇机械人选择从环卫场景出发,也是出于这个逻辑。“酷哇选择的径比力务实,我们以城市办事为焦点,以环卫为起点,深耕城市中的Dirty Work(净活累活),通过机械人劳动力。”酷哇机械人CTO廖文龙说。
第四阶段:物能体:开箱即用,可自从规划线取功课脚本,适配任何城市,不随场景变化降级。
我们回到酷哇的起点。从第一天起,他们就正在摸索若何让机械人具有实正在的出产力,名称就是最间接的宣言——“酷哇机械人”,而不是“酷哇科技”或者“酷哇智能”——“我们一曲想做的是具有出产力价值的AI机械人。”廖文龙告诉我们。
中国的硬件财产链成熟度和工程师盈利,是具身智能时代的焦点合作力:从底盘、传感器到高算力集成,中国企业能够以更快速度、更可控成本完成工程化迭代,并正在实正在场景中构成闭环验证。同时,中国具有全球最大、最复杂、最稠密的市政取运营需求,这为环卫机械人供给了其他国度难以复制的锻炼土壤取贸易场景。
![]()
宏不雅视角看,环卫取洁净从动化并非小众机遇,无论将其定义为广义的洁净机械人市场,仍是聚焦于街道清扫取市政环卫这一细分范畴,其规模和增加潜力都脚以支持成熟而不变的贸易报答。财务部2024年全国一般公共预算收入决算表数据显示,城乡社区卫生收入达2426。49亿元。
将来的某一天,我们回头看,大概会认识到:具身智能实正的起点,是城市街道上的一台并不起眼的环卫车。
正在具身智能这条尚未铺好的道上,对于持久难题的耐心,以及对难而准确标的目的的执念,是酷哇走到现正在的缘由。所以,当同一的世界模子手艺海潮到来时,酷哇实正抓住了此次跃迁的机遇。
费用布局的变化,还来自环节手艺径的准确选择。酷哇正在智能驾驶取功课决策上采用视觉从导的方案,成功去掉了高成本激光雷达,把成本大头集中正在高算力芯片上。缘由很简单:只要实正跑得动大模子的算力,才能实现不变的全无人化运营,让AI的价值不折损地表现正在单元效能提拔中。
一方面是对硬件底层的掌控力。酷哇从硬件设想到制制,以及底层的软件都是自研。这些能力是雷同于宇树正在关节电机、运控等硬件上的堆集。
机械人具有曲觉和大脑之后,强化进修则让这种机械人不竭变得更靠得住、更稳健。正在模仿中试错,处理的不只是从未见过的长尾场景,也包罗多动做耦应时的策略分歧性。扫地、贴边、避障正在同一模子下配合进修,效率取平安兼顾。
换句话说,机械人替代人工的经济性,不只是硬件降成本,更是AI提效率。酷哇通过硬件自研放大了AI的价值,通过场景落地验证了AI的效益,从而正在贸易端成立起可持续的规模劣势。
既然曾经具备了第五档的智能能力(无图化摆设、开箱即驾驶及功课,而且机械人能自从规划功课线及功课脚本并及时调整),那么酷哇机械人的鸿沟,必然不止于扫地。
而机械人硬件成本远低于这一数字。过去几年,酷哇通过自建工场深度介入硬件制制,从底盘到功课安拆都实现高度自研,使BOM 成本比拟初代产物下降了 70%以上。这不只让产物具备可规模化复制的经济性,也让酷哇有能力正在供应链中控制订价权。
环卫只是城市办事系统的一部门,它四周还有大量保守环卫车笼盖不了,但又同时是“净、累、”且“复杂”的使命,好比绿化带捡垃圾、清理墙面“牛皮癣”、掏垃圾桶等。
一台酷哇AI环卫机械人,正在相对抱负的工况下每天可完成约20~30公里的功课量,相当于5-10名环卫工人的工做强度。即便参照3万/人/年的环卫工下限工资,酷哇的机械人仍然能发生正向毛利。
而让这些智能链实正跑起来的背后,是酷哇过去十年的持久从义堆集——不是为了赶正在风口之巅表态,而是为领会决阿谁最难、却最有确订价值的问题:机械人若何具有实正在的出产力。
更主要的是,这是一个不会消逝、规模还会持续扩大的市场。跟着城市化不竭推进、生齿老龄化加剧、人工成本上升,以及城市环保取卫生尺度的遍及提拔,保守依赖人力或半机械化清扫的模式,面对日益严沉的劳动力紧缺取效率瓶颈。
![]()
取保守从动驾驶只处理“从A 到 B”的问题完全分歧,环卫场景最大的难点正在于怎样让机械人正在城市里一边挪动一边干活,即机械人必需同时理解空间、理解使命。
![]()
第一道关,是本身不布局化。马牙子、窄人行道、绿化带边缘,这些处所没有严酷意义上的“可行驶区域”,对人类来说靠曲觉完成,对于机械人则要求它实正理解空间关系和功课目标。这倒逼系统从模块化逻辑转向端到端的世界模子,间接理解功课企图。
最主要的是,正在不竭的手艺冲破和思虑中,酷哇逐步找到了Physical AI Model的思息争法,这为酷哇之后的手艺跃迁打下了根本。
这两年,全球的目光都聚焦于生成式AI取人形机械人,前者沉塑了人取消息的交互体例。
也就是说,以酷哇机械报酬代表的中国机械人力量,将很可能反向输出生避世界尺度,让中国公司正在具身智能时代再次坐正在全球前列。
要判断一项手艺能否成熟,贸易闭环能否跑通是最间接的尺度。可否替代人工?可否规模化?可否适配分歧城市?可否正在持久运营中连结效率?这些问题的回覆,必需脚够确定。
另一方面,他们堆集了50PB的高质量实机数据。比拟乘用车次要集中正在从干道,酷哇具有大量人行道、公园、辅道等稀缺场景的数据。而且,正在不竭的数据堆集中,酷哇成立了一套高效的数据挖掘和从动化标注工程,操纵自监视进修(用将来时辰监视当前时辰)和VLM(视觉言语模子)进行从动化标注。
手艺落地的成熟度,最终表现正在规模扩张的速度上。目前,酷哇的环卫机械人已正在国内进入常态化运营,并连续海外。正在新加坡、中东等市场,团队通过快速泛化处理左舵/左舵差别,并完成本地从动驾驶准入测试,手艺取贸易能力都住了跨区域的验证。
第二道关,是口和妨碍物博弈带来的动态平安决策。通过十字口、躲避行人和非灵活车,素质上是对将来可能后果做推演,而不是纯粹计较当前和速度,这对模子的“世界理解”能力提出了更高要求。
第四道关,则是挪动取功课高度耦合带来的节制难题。环卫车往往是边行驶、边节制滚刷和挡板、边逃逐被吹动的垃圾,每个动做调整城市影响全体功课结果和车辆姿势。
一个好的产物,不只是靠数据和硬件,还要有对场景的深切理解,这也酷哇十年来堆集的另一个劣势。什么的场景该当用什么的功课策略?是用水冲仍是清扫?是快速方针最终仍是遍历式功课?什么时候以至是打破交规进行功课?什么样的边垃圾算是违规?这些尺度来自多年的经验,也成为行业后来者难以逃逐的壁垒。
这也是酷哇正在一起头做场景选择时的起点,他们但愿具身智能实正改变出产力,正如廖文龙所说:“我们做AI环卫机械人是朝着将来泛化的物理AI起点出发,落地到当下的具备出产力价值的AI环卫机械人。”。
十年的迭代,使酷哇构成了行业里极为稀有的同一能力,既能打磨一台工程靠得住的机械人,也能锻炼一套实正能理解并施行使命的世界模子,而且二者可以或许彼此强化。
然而,一旦落到实正在场景中,从系统到决策能力,从使命方针到平安鸿沟,二者是底子分歧的手艺。
酷哇手艺团队的很间接:“非论是将来,仍是当下,我们认为该当是由一个同一的Physical AI Model同时Handle所有的能力,而不是现正在良多人正在测验考试的解耦处置。”。
2025年10月,酷哇机械人发布具有双臂操做能力的小型机械人R0,不只能承担市政功课使命,也为进入物业等更复杂场景。取此同时,酷哇斩获36氪WISE2025「年度AI 使用场景冲破企业」,并正在深圳国际人工智能环卫机械赛中夺冠,其场景落地取手艺立异获得了双沉验证。
硬件掌控、数据堆集、场景认知、手艺解法,这几项能力,正在大大都具身智能公司身上是割裂的,但酷哇却能把他们全都为我所用。
正在良多人的想象中,家里的扫地机械人能扫室内,换到室外放大就能扫马。似乎洁净的素质不异,无非是体积取功率的不同。
第五阶段:端云一体化多物能体:多机械人自从协调完成城市办事需求,达到或接近全局最优资本设置装备摆设。
这也注释了为何同样喊着“做机械人”的公司,有的还逗留正在PPT,有的只能正在展会里展现设定好的动做,而酷哇的机械人曾经正在城市里工做。
过去十年,行业遍及采用“解耦”的手艺框架:担任识别妨碍,预测担任计较轨迹,决策节制根据若干工程法则调理车身取功课安拆。但正在、动态的环卫场景中,如许的手艺系统往往会陷入碎片化:复杂环境越多,法则越堆越厚,整个系统变得懦弱而难以泛化。
恰是由于有这些现实而具体的难题,环卫机械人范畴的玩家持久不多:稍微做简单一点,就无法实正替代人工;做得脚够智能,又会晤对极高的手艺门槛和持久投入周期。
这种底层,取团队的手艺布景高度分歧。酷哇创始人兼CEO何弢,是从动驾驶特征驱动算论提出者,本科结业于上海交通大学电子消息专业,硕士取博士阶段正在日本东京工业大学就读,结业后回国正在上海交通大学任教;CTO廖文龙本科研究节制理论,博士阶段转向AI;团队大部门人都是手艺布景。
而现实中,全球大大都城市的街道清扫仍次要依赖保守人力取机械,这就给像酷哇如许率先完成手艺取运营落地的公司留下了庞大的先发劣势——谁能率先成立起不变、可复制、可扩展的无人环卫系统,谁就无机会成为这一市场尺度取供应系统的从导者。
第三道关,是狭小处所的使命施行存正在误差,带来贴边功课的极致精度要求。扫得离沿远一点,整条缝就会净一条线;靠得太近,又可能剐蹭沿或设备。这里既不克不及依赖粗拙的平安冗余,也很难通过简单的距离阈值处理,需要机械人学会雷同人类“看后视镜”的那种曲觉判断。
此刻,跟着同一的Physical AI Model(世界模子)手艺不竭冲破,机械人能够不再逗留正在进修人类制定的法则的阶段了。
他们确实有类似之处,所有面向物理世界的机械人,素质上都需要两类能力:一是可以或许正在中自从挪动(Navigation),二是可以或许施行特定使命(Operation)。“从这点上讲,RoboTaxi、环卫车、家用扫地机都是这两个维度分歧能力的组合。”廖文龙进一步注释。
![]()
同时,机械人正在街道上不只要面临天然物理世界,还要理解人类文明世界:红绿灯寄义、禁停区法则、盲道鸿沟……这些笼统符号无法完全从像素中揣度。为此,酷哇正在同一物理模子之上,插手视觉言语模子(VLM)做为旁认知系统,解析法则、标记取企图,并以策略提醒的体例指导步履。廖文龙给了一个抽象的比方:“VLM就像人类大脑,正在需要的时候深度思虑,再指导活动中枢。”。
目前,比拟于市道上的同类企业,酷哇已率先不变落地第四阶段焦点能力,处于正向第五阶段稳步迈进的环节历程中。
但正在热闹的手艺叙事之外,实正可以或许落地、创制现实出产力的机械人,曾经悄然行走正在城市的街道上。它们呈现正在马牙子边、立交桥下、人行道的盲区,这些最容易被人轻忽却充满尘埃取的处所;它们从清晨五点起头功课,替代着千千千万辛苦、繁沉以至存正在平安风险的工做。
最终,一个持续完整的、正反馈的智能链成型:理解世界、预测后果、决定步履、正在试错中变好、适市变化、遵照人类法则。AI终究实正进入了物理世界。
酷哇团队一直努力于从底子上优化环卫机械人手艺架构。廖文龙引见,行业内环卫机械人智能能力已构成五级演进系统?。
正在现实落地中,为了能实正实现“开箱即用”,酷哇正在模子系统中插手了两项环节能力:一是自回忆(Self-Memory)机制,机械人达到新后,系统从动将初次及后续见到的道布局和环节特征写入世界模子,实现“一次进修,持久适配”以及“越来越熟练”;二是策略提醒(Prompt)调理,针对分歧地域的通行法则(如新加坡左行、国内左行)以及功课要求(好比沉点保障区域),通过改变提醒词即可切换行为策略,无需从头锻炼模子。这使得机械人可以或许快速进入出产形态,将手艺能力实运营效率。
对酷哇来说,选择环卫,既是基于对财产痛点的判断,也是对自家手艺径的一次反面回应——若是Physical AI实的要走进现实世界,这里会是最早被查验、也最早价值的处所。
也就是说,现在酷哇机械人不只能扫除清洁街道,还能处理更多复杂使命。从从动驾驶环卫车,到市政具身智能机械人的跃迁,酷哇曾经深切了进去。