具身智能时代。
本场《具身智能时代:大模型如何重构机器人投资逻辑》圆桌对话,由蓝驰创投合伙人曹巍主持,对话嘉宾为:
至简动力联合创始人兼董事长王凯
深庭纪创始人兼CEO王弢
曹巍:这场论坛我们非常荣幸地请到了王凯总和王弢总,一起聊聊大模型时代机器人的投资机会。先请两位简要介绍一下自己的企业。
王凯:至简动力聚焦通用具身智能,目前的主打产品从类人形切入,面向To B和To C市场。
王弢:深庭纪是一家扎根在苏州吴中区的具身智能机器人企业,主打产品是一款面向家庭的双轮足户外陪伴机器人。今天这款产品也在现场展示,出左手边的门就能看到那台很可爱的双轮足机器人。
曹巍:二位的介绍都很简明扼要。我也简单介绍一下蓝驰创投,我们源自硅谷,专注硬科技领域的早期投资,在国内已投了超过250家优秀的早期科技企业,目前每年在科技领域的投资规模在15到20亿元,一年投30到40个早期项目。
刚才两位都比较谦虚,我补充一些他们的个人背景。做早期投资,跟团队之间总有各种各样的缘分和感情,王凯总曾是理想的CTO,理想上市后在组织、技术团队搭建、供应链生态整合以及面对下一代产品竞争等方面,都需要将团队整体升级。为此,王凯总不远万里从欧洲回到国内,带领理想的技术团队完成了一次重要攻坚。L系从L9、L8到L6等一系列成功,都和当年王凯总打下的供应链生态和产品基础密不可分。
王弢总跟蓝驰也很有渊源。王弢的第一次创业是在硅谷,与他的老师——智驾领域非常知名的吴恩达一起。吴恩达的第一个创业公司是Drive.AI,王弢是联合创始人之一,他们在硅谷将这家智驾公司做到了技术非常领先的阶段。后来公司被苹果并购,王弢加入小鹏,成为小鹏在智驾方案上非常重要的技术负责人。
回到今天的主题:变化。无论是创业者还是投资人,看待时代时都会关注变化,而最大的机会一定与变化紧密相连。过去两三年,科技领域最大的变化是大语言模型和多模态模型的快速崛起。同时,海外也成长出一些全球科技霸主,比如昨晚刚发布新模型的Anthropic,以及大家日常使用的OpenAI的ChatGPT。
想请两位分别谈谈,在你们看来,机器人领域、具身智能领域,你们看到了哪些变化与机会,从而促使你们决心投身这波科技浪潮,将具身方向与自己的新创业征程结合?
王凯:从我的角度来看,我的背景是做了十几年智能手机,又做了十几年智能汽车,分别在OEM和tiers工作过。穿透这两个行业,走到今天,纯粹从物理世界出发,我觉得具身智能是时代的下一个最大单品,就像当年智能汽车和智能手机那样,这个赛道对于任何想成为风口浪尖上时代弄潮儿的人来说,都是一个绝对不能错过的机会。这是第一点。
第二,技术变化确实很快,大家可能都认同AI将改变整个世界。AI会分成两大部分,一是在纯数字世界里与AGI、Agent相关的部分,另一个就是在具身领域,但凡与物理世界发生交互的部分,这两者都应是由AI驱动的,因此很多演变过程会有相似性。这个领域我看到了大量能大幅提升生产力的机会,这是一次由技术带来的巨大革命,可能会比当年互联网改变世界来得更剧烈。
接下来的一些趋势,OpenAI和Anthropic给了我们启示。包括我们至简动力的几位联创在内都在思考,具身接下来会经历两次重要节点:
第一个节点,很像当年OpenAI所做之事,就是具身的“GPT时刻”何时到来,它将产生巨大价值。因为具身最重要的意义在于泛化性,能够替代许多以往只有人类才能完成的工作,让机器人全面替代并提升效率。
第二个节点,如同今天的Anthropic,可能会打出一个非常高价值的应用,这一点尤其令人兴奋。我们在时间线上也有一些判断,最快可能在两年内,具身的“GPT时刻”就会出现,相当于具身方向上的“OpenAI”公司,可能产生巨大的价值。
下一步,就看谁能在具身领域抓住那个“coding”的机会,这会带来巨大的价值回归和生产效率提升。
王弢:王凯总的很多观点我都非常认同。回顾过去十多年,我一开始做自动驾驶,从Drive.AI到2019年加入小鹏汽车,一直从事自动驾驶和感知AI。
我转向机器人领域是在2023年初,那时我从小鹏自动驾驶转到小鹏机器人团队,负责机器人大脑。之所以主动提出内部转岗,是因为看到了大模型GPT的能力,包括对复杂任务的拆解,以及对非预设语言非常自然的响应。
看到这些以后,我认为机器人与人进行自然交互并自动拆解任务,这件事变成了可能。在此前很多年中,我做自动驾驶时许多任务都是靠规则手写,有了GPT后我第一次看到了这种可能性,所以当时我非常兴奋,就转去了小鹏机器人团队。
在机器人团队待了一年的过程中,我发现行业正处在剧变的前夕:当时大语言模型已经能对机器人任务进行拆解,但对物理世界和空间的理解还很欠缺。这也是这两年具身发展的一个主题。
回到关于大模型在机器人领域的应用和前景这个问题,我认为有以下两点。
第一,大语言模型对3D空间的理解还需要一到两次范式突破。今天的所谓VLM模型、VLA模型,以及最近非常火的世界模型,对真正物理空间和物理定律的拆解与理解,仍然相对薄弱,但正在快速发展。
第二,具身机器人尤其是与人进行复杂交互、具备任务规划并且能理解环境的机器人,是非常复杂的系统工程。这类系统工程过去需要非常庞大的团队,像蔚小理自动驾驶团队动辄两三千人,对创业公司来说极其困难。但今天在大模型的加持下,比如借助Anthropic和其他代码工具,人效被提升到了过去的三到五倍,原来需要十个人做的事,现在只要一两个很厉害的工程师,配合AI能力就能完成。
因此机器人企业必须从上到下全链路地拥抱AI和AI工具。我们机器人的动态表现、声音、表情以及与人交互的设计,都大量使用AI来生成。陪伴机器人能够与人自主交互,对环境有多模态理解,也得益于大模型,尤其是带视觉的多模态模型的突飞猛进。
曹巍:两位的分享很精彩。我们看到了许多技术变化,但大家普遍感觉还差一点火候,还处在数据储备期、模型架构的创新期以及场景突破前的临界点。这些点可能都需要大家努力突破,才能看到我们所期待的ChatGPT或者说GPT-3.5那样的效果。
换一个大家也很关注的问题。二位都有大厂背景,王凯来自理想,王弢来自小鹏。市场上有一种观点,认为之前的经验对创业既是基础,也是一种可能的束缚。想听听二位怎么看,车企搞自动驾驶的背景,对做具身智能机器人有哪些宝贵的帮助?你们又是如何借助这些帮助,同时让自己“清空”,保持归零心态去吸收和学习新东西的?
王弢:过去在大厂确实学到了很多,比如一套严格的开发流程,以及如何在自动驾驶领域构建可用的数据闭环,还包括每一次OTA升级自动驾驶功能,需要经历回归等测试来确保性能不比之前差,同时改动之处要达到预期,这都需要有非常严格的流程。这些对创业公司而言是宝贵的财富,整个研发流程和体系很大程度都可以去借鉴。
此外,对于深度学习或大模型能力边界的认知,真正做过量产落地的人对边界有清晰的感知,在做技术时就不会天马行空,不会去提目前阶段完全不可能或不现实的功能。
我看来,从大厂、特别是自动驾驶领域转向To C消费级机器人,我自身需要补很大的一课,就是对消费的认知、对产品的洞察和理解。我是研发出身,这方面的经验相对欠缺。但过去两三年我里一直在恶补这一块的认知能力,现在已建立起从市场、产品定义到技术方案的完整路径,更面向消费者和真实需求去听用户的声音,更多是“出题”的思维,而不是“解题”的思维。
过去可能觉得只要把自动驾驶技术做到极致,产品自然就成立,但To C消费品,尤其是陪伴机器人这个新品类,能做的方向太多了,必须聚焦,而这个聚焦需要创始人亲自决策,决策过程中需要很深的产品洞察,比如机器人做多大、全身用多少个关节和自由度、需要激光雷达还是纯视觉方案、对用户的价值主张是什么等等,这些都是我们需要额外学习和思考的。
王凯:至简动力团队虽然来自于大厂,但它有个特殊性,它源于理想汽车智驾团队,不同于成熟固化的大厂团队,这是个从零开始的、拥有创业基因的内部创业团队。因此我们经历了0-1,1-10,10-100完整过程,再加上大厂体系化的赋能,这对我们的成长和帮助巨大,这是第一条。
第二条,这次创业面临的挑战确实很多。具身赛道很多人认为和自动驾驶很像,自动驾驶广义上是具身智能第一个较简单的落地场景,但今天如果谈通用智能,整体环境的难度要大得多。
难在四件事同时处于0到1的状态:具身模型侧是0到1,尚不成熟;技术路线尚未认定,数据是0到1,需要大量采集数据,包含无物理本体数据,有很大的优化空间;市场是0到1,当年自动驾驶好歹有全球近一亿辆车的存量市场,今天的具身市场完全不存在;供应链也是0到1,整个为具身打造的供应链体系还没有。
所以当面对这四个0到1时,从业者该如何解局,这件事远比当年的自动驾驶更难。我们带着大厂背景和内部创业的经验,但要挑战一个极难的题目,这个赛道很大,前景也很好。
曹巍:你觉得在体系化方面,至简动力有哪些原生的、考虑得比较体系化或成建制的思考?
王凯:关于这一点,也是我作为理想第一任CTO的非常好的经验。我们的团队确实是朝着“智能组织”去打造的,研发包括前沿研发、平台研发、量产研发,最后到商业化。所谓智能组织,就像一个有生命体,需要有很强的感知能力。
我们有一个在理想经过正反馈验证的打法,非常强调“以终为始”,用商业化来驱动研发。先通过商业化团队,结合大数据、大计算和行业感知,定出超越用户需求的商业spec,然后进行“互锁”——这个词很重要。我在很多论坛曾讲过,智能时代企业最重要的关键词是“互锁”,区别于互联网时代的“复盘”等词。
互锁从超越用户商业需求开始,互锁并定义到产品spec,再由产品spec推导出平台R&D的spec,最后落到前沿研发,明确该定向做什么样的论文和专利。这种指导方式让我们的整体运营效率极高。
当年自动驾驶领域,我们团队在自动驾驶领域发表论文的总数与引用数的乘加值,是产业界全世界第一名。今天我们带着这种经验来到具身,成立不到一年已产出大量论文,每篇论文都是带着商业化的KPI去做的。
曹巍:讲得很精彩,核心就是基于先前经验,以商业化洞察的视角去牵引和拉动从前沿研发到工程化量产、产品体系和迭代的全链条。
刚才提到了传承,还需要创新。在这个大模型时代,我们看到一个很大的变量,模型本身就是这个时代生产力极致表现的浓缩,无论是做设计,还是coding Agent,都开始融入工作流去重构组织。很多大厂因为组织庞杂、体系化,反而很难快速适应AI原生的工作流和AI原生能力的赋能。
我想先问王弢,你们是一家很年轻的公司,在打造AI原生组织、把AI融入自身体系、尽可能发挥最优模型能力方面,做了哪些事情?这属于在大厂时代没做过的事情,就是当下如何把AI更好地融入现有的体系?
王弢:简单说一个词,就是“舍得花钱”。把钱花在token上肯定是值的,在token上多花5万块,我大概率就省下了一个年薪30万的工程师,这是我们亲身体验。某些模块过去需要十个人做,现在一两个人就能做,甚至有工程师给自己“养”了五个Agent,自己当老板,让Agent每天帮他干活。
今天在整个工作流中使用Agent仍处于非常早期的阶段,没法做顶层设计。我不会一开始就要求全公司该如何使用Agent,反而会去观察基层同事怎么使用、怎么提效。一旦发现巨大的提效机会,我就把那个典型拿出来在全公司推广,而不是自上而下地设计Agent工作流,这是一种自下而上、有机的方式。
同时,在各个工作流里我都尝试使用Agent,不只是写代码,还有机器人交互的固定语料生成、声音、动作效果等,我们都优先考虑用AI、用大模型的方式去生产。哪怕有时候靠AI需要摸索,速度可能比用过去的经验直接写规则稍慢,但时间的复利站在AI这边,因为AI越用越好,越用越熟练。当整个工作流融合在一起时,这个组织转起来会比传统组织快很多。
王凯:我补充一点。就我们公司而言,我同意这种能力是自下而上长出来的。最大的感触是,这件事要向年轻人学习。我们从第一天起就和大学成立了联合实验室,这些学生们每周都坐在我们办公室里的。
我们最顶流的一个学生全职在我们这里实习,每天能用掉1200万个token,让我非常震惊,我们很多工程师都达不到这个量级。这个学生才17岁,还在大本就已经拿到了直博资格,让我特别感慨。
真正实操中,我们先从工程师和最年轻的人开始,虚心向AI原生一代学习,再慢慢沉淀,打通整个组织。我也鼓励法务、财务、PR团队都用Agent提升效率,当形成了最佳实践后,就可以迅速沉淀下来成为流程化的结果在公司推广。
曹巍:回到未来市场机会这个问题上。蓝驰从2016年开始投资机器人和硬件相关领域,也投了包括理想、高仙机器人、智元机器人等优秀团队。我们看到一个特点是大家都很关注海外市场。
两位都有超过15年的海外生活工作背景,想听听二位如何看待海外市场在未来企业发展中长期的重要性,以及怎样评估当下中美在具身智能方面的差距或状态。
王凯:这个问题上,第一,中国有非常强大的供应链优势,这在全球可能独一无二。就像苏州的强大供应链,我们在创业过程中深受苏州地方政府、生态和本地资本的巨大帮助。
我们设计一个图纸出点问题,马上修改,从出图纸到供应商把零件送到桌前只要30分钟,这让我非常激动,而美国具身方面的这种能力极其欠缺。同时也要看到,中美在具身方面的经验上,GPT时刻大概率是美国先搞出来,他们的优势太明显,但从长线来看,因为机器人终究发生在物理世界,中国人能迅速追平,并借力供应链优势。
总之长期来看,我对中国在具身领域的领先非常乐观。
对我们自身来说,出海肯定是很重要的一环。首先在中国把产品打磨好,然后很大比重的营收将来自于服务全世界。因为全人类的需求是相似的,国内的实践可复制,在海外可以获得更高回报且摊薄成本,这正是我们全球化想做的事情。
王弢:户外陪伴机器人解决的最核心问题是人类底层的心理问题——孤独,这在国内外都一样,人性是相通的,解决了最底层需求,产品在国内外都成立。
我们现在的产品调性,从一开始就更偏向出海,包括外形和人设,更偏向欧美用户可能喜欢的贱萌的人设表达。不可否认,北美市场上尤其是高客单价的消费品,可能仍然是全球标杆。
近两年由于AI浪潮,美国的收入体系在变化,高收入人群特别有钱,也有不少中产面临阶层滑落。富人通过科技发展收获了红利,对科技类产品接受度更高,而可能滑落的中产也很焦虑,希望孩子首先不要因孤独产生心理问题,其次在迎接AI浪潮时能先人一步。这部分焦虑也能推动产品更快、更早走向市场。
关于中美差异的问题,我非常认同王凯总说的,国内供应链实在太强大了。在苏州吴中区,周边三十公里内就能找到所需的所有零部件。历史上也有经验,2015、2016年前后美国有几百家无人机公司,今天基本都不存在了,可能剩下一两家也主要靠政府订单。在真正的市场化竞争中,凡是涉及软硬结合的产品,中国有巨大的供应链优势,这也是我们为什么坚定把研发和大批量人员放在国内。
对于GPT时刻的来临,我的观点和王凯总稍有不同。我认为谁先把数据闭环跑起来,谁就更有优势去接近GPT时刻。
即便美国在算法上先推出顶尖成果,这并不影响中国公司去竞争成为下一个OpenAI。举个例子,GPT中的“T”所代表的Transformer注意力机制是谷歌的科学家发明的,但真正收获巨大红利的并不是谷歌,是OpenAI以及英伟达这样的公司。这涉及到商业最底层的逻辑:谁能触达更多用户、拥有更多数据、把数据闭环跑起来并建立商业闭环,这个更重要。
曹巍:今天在苏州,也请两位简单聊聊在苏州创业的感受,或者还有哪些需求与帮助?
王弢:来到苏州有一点偶然。当时想快速把事做起来,听说吴中太湖新城有现成的办公场地,一看非常新,就过来了。来了之后非常喜欢这里。整个节奏不像北上广深那样烈火烹油,非常适合早期团队沉下心来把核心问题解决和想清楚。
人才方面,苏州对周边城市的人才吸引力比较强,我们也招到了来自全国各地的人才,一方面是因为公司的愿景,另一方面大家也很喜欢苏州的生活节奏和大环境。如果说下一步需要什么,可能是更好地打出苏州这张城市名片,吸引全国乃至全球的人才到苏州来。
曹巍:苏州的文化气息和环境能让大家安安心心把产品打磨到极致。
王凯:我总结了四点特别深的感受。第一,苏州有非常强大的供应链集群,各行各业的企业都离得特别近;第二,有巨大的市场和机会,这里的制造业本来就很棒了,现在面临AI时代的升级,存在着大量客户;第三,感谢苏州的政府,特别务实,帮我们解决了很多问题;第四,我深有感触,苏州地方基金也非常务实,和地方政府形成了很好的联动。
这四点是我们来到苏州最大的感受。如果说有展望,我希望这四件事在苏州的联动能更剧烈,为AI新时代的来临做得更好。
曹巍:谢谢二位关于苏州创业体验的分享。今天聊得非常精彩,也感谢二位带给苏州的创新创业活力。希望明年苏州再见,谢谢!
靠谱的线上股票配资
元鼎证券_元鼎证券配资平台-欢迎了解平台服务,轻松开启投资体验提示:本文来自互联网,不代表本网站观点。