必赢国际官方入口_必赢电子游戏网站

靠近机器人GPT

2025-09-13 09:37


文字|硅谷101作为切割场,在该切割场中,人工智能和机器人相交,具体的智能是当今技术领域中最有前途和最有希望的方向之一。其中,机器人/体现模型扮演着“中央大脑”的作用,使机器人能够在复杂而可变的环境中实现独立的研究和持续发展。因此,大型模型的研究和开发已成为建立机器人行业(尤其是整体机器人)取得非凡成功的主要联系。 9月8日,中国体现的智能公司独立变量机器人开放了其体现的墙模型的来源。 9月9日,美国人立即开设了智能公司的体力智能(PI,π),该智能还开放了资源nan的模型。顺便说一句,中国和美国公司都在同一时间开设了自己的车型。 2025年,生态系统的开源AT体现在一个大型模型中,进入了一百个花朵开花的发育阶段。这种趋势使人们想起了过去几年Chatgpt代表的语言模型的进化路径:从2018年的社区资源的最初增加到2020年5月3日的Chatgpt-3的全球关注,它持续了三年,以使语言模拟变得成熟。那么,机器人模型距离“ GPT-3时刻”有多远?在本期的“硅谷101”中,Hongjun邀请了自变量机器人的首席技术官王霍和体育智能研究员凯·凯。他有一组论文π₀和π₀。让我们谈谈今年机器人模型领域的重要成功,当今的挑战是什么,机器人在中国和美国的道路有什么区别,以及在整个方案中将实施多长时间。以下是此交流内容的选择:01行业突破和Hongjun General WAsings:您认为在2025年,机器人模型领域中最重要的成功是什么? Ke Li Yiming:我已经在机器人上工作了大约七或八年。我认为在过去的两三年中,机器人模型的受欢迎程度刚刚开始爆炸。在我的初步研究中,我没有使用许多大型模型和其他东西,但是我做了一些独特的工作。当时,我发现一组事情可以解决方案解决特定问题。虽然运作良好,但很难便宜,轻松地将它们复制到新问题。因此,在探索大型模型的路上,最大的惊喜探索是我验证了该模型的大学,因此我可以开始探索性能的概括和改进,然后我将开始讨论机器人大型模型的可能性。在机器人领域,我认为我相信两三年前的大型模型的技术途径。 Wang Hao:有一个非常明显的现象也就是说,它对应用程序具有指数效应。其背后的驱动力确实来自通用机器人主要模型的开发和发展。在2023年之前,我们中的许多人都会专注于一项任务,并在极端上做到这一点。但是,现在我们有了AA基本模型,我们可以同时知道。培训和实施道路-A-千分之一的任务确实意味着我们的优化目标已经改变,重点是提高所有任务中整个模型的平均成功率。它也是开发指数效应的基础。现在,我们可以开始执行复杂的长期任务(长途工作,其中包括一系列正在进行的步骤,需要机器人执行多步推理,计划和实施的复杂活动,最后完成)。这是一个令人惊讶的现象。 Hongjun:我现在将总结关键字,一个是探索整个机器人模型的一般将军,另一个是复杂的长期工作。请给我们一些examplesto说明,例如,机器人可以做什么活动,但是他们可以在2025年做什么?或者过去,机器人只能在某种情况下仅限于特定任务,但是现在它们可以转移到其他方案?图像来源:物理智能Ke li yiming:2024年,PI(Americal Intelligence,美国体现的情报公司)释放了π₀,当时旨在促进能力。最具代表性的例子之一是折叠衣服的任务。这项工作已经在机器人行业完成了十到二十年,许多人已经研究了这项工作。人们通常认为很难让AI玩,因为Go非常复杂,而且每个游戏都不同。的确,在我们的日子里 - 一天的生活,折叠的衣服,对Mman来说似乎很简单的工作也很复杂。例如,衣服上可能有两个褶皱,三倍或特定折叠的角度可能是新的情况n对于机器人,需要解决太多不同的情况。同时,折叠衣服有许多不同的步骤。您需要先折叠它们,然后将它们折叠。有这样的坚持。复杂的细分和副词 - 使过去很难解决折叠衣服的工作。到2025年,我们还开始探索许多泛化方向,例如将π₀.₅模型放在移动机器人上,然后将移动机器人放在另一个且尚未在家中。它们不在模型数据集中,模型可能不知道它将如何反应,然后我们观察到它是如何进行反应的。在此过程中,我们发现实现概括是非常有希望的。尽管机器人的性能并不完美,但它似乎显示出像人类一样的小特征,例如获取事物并将其更改为其他情况。 Hongjun:需要什么样的东西?在我的理解中,衣服是柔软的布,但是如果您选择杯子或碗,没有什么不同?因此,处理问题是一个简单而不是简单的问题。例如,如果您想拿一杯水,即使它完全是同一杯水,也是达尔费尔不同环境中概括的表现。所需的策略是不同的。即使以后,我也告诉机器人,即使去了新房子或完全不同的杯子,也必须完成杯子。概括的完整结果需要进行此类进行性测试。图像来源:体力智能Hongjun:SOπ₀。与π₀相比,其演变在哪里?您刚刚提到它可以让它进入新房子,并且仍然适合这种环境,这是一个重点。但是,例如,任务有一些局限性吗?他们的活动是多少?哪些活动尚未移动?它的规则是什么?请简短地向所有人解释。 ke n b b b dy“多样化”数据确实不容易指定,因此我们决定放置机器人t在不同的外部房屋中进行测试。在此过程中,我们发现我们不知道在完成之前需要收集多少不同的房屋。我们需要收集和测试它们,同时也想知道:今天有助于收集3家房屋的数据吗?如果我们收集了其中30个,这将无济于事,这是否意味着无法完成这条路?幸运的是,在我们收集了许多不同的数据之后,我们训练的模型最终发现了调节验证时验证能力的能力。也就是说,在某些新环境中的性能比以往任何时候都更好。当然,没有任何新的环境很好。现在仍然有一些限制,但是所有人的感觉和探索都存在。将来实施绩效的房间仍有许多可改善的房间。 Hongjun:在开发机器人模型的过程中,您认为问题的最困难是什么?例如,这是因为数据量相对较小,还是Algorithm问题​​? Wang Hao:困难之一是对物理世界产生长期影响的稳定性(稳定性的翻译是指可以承受外部压力并影响其原始状态的事物的本质),例如环境和光线造成的一些视觉错误。尽管可以通过使用更好的传感器,更强大的计算能力以及更好地开发模型来帮助您合成和增强数据的更好的开发模型来缓解这些长期效果,但真正的困难是如此之多的时间可能性,我们无法预测所有可能的角案例(侧面和角落)。图像来源:自变量机器人,因此无法事先学习这些情况。例如,当机器人执行任务时,桌布可能会出现小皱纹,杯子可能不稳定,并且透明的物体可能会反映出光线以干扰相机,等等。另一个困难是,在长期活动中,许多小小的物理骚扰会导致各种各样的变化小错误会像滚雪球一样加强,而尾巴结束时的错误会直接导致任务的失败。因此,我们需要解决的是如何使模型求解数据中无法包含的不同角色案例。它的主要部分是为模型的ONEG基础,以了解物理理解和物理直觉,以便模型具有空间理解和推理能力。因此,这个主要问题是我们应该结合真实的机器人数据,人类视频数据等,以便数据的规模更大,资源更丰富,质量更高和更多样化,以便机器人可以从本研究过程中理解物理定律。但是,目前与现实世界相互作用的高诚实数据非常困难。获取这些数据并不意味着您只能在世界上真正愤怒地收集它。这件事比想象的要复杂。这不仅是一个数据量,而且是垫子数据工程和数据管道的TER,例如如何降低数据的获取成本。 Ke Li Yiming:我也认为有很多困难,而不仅仅是一两个困难。我认为Wang Hao刚才提到的问题是困难之一。从研究的角度来看,我认为很难尝试机器人模型的性能。人们经常看到一家公司开设了一种新的大型语言模型,并已成为特定列表中的第一名。在机器人世界中,近几十年来,无法在机器现实世界中列出这样的列表。无法告诉您它非常客观,绝对和重复 - 重复:在什么情况下,性能模型的性能要比模型B更好。制作此列表的困难是模型。它可以在某些地方表现良好,在其他地方不好。您需要包括几种不同的情况?如果您想有一些角案件,那将是无尽的。同时,如果您愿意为了列出真实机器的列表,您还应考虑维护,详细信息,如果模型性能会影响真实机器的性能等。因此,当整个机器人行业发表论文时,它通常会依赖于自己,无论是设定还是审查官员。 “今天我制作了一系列算法,我们认为这比这项工作的某些方法要好。”缺乏统一的检查机制会减慢智能领域的发展,因为您很难确定哪种更好,模型A和模型B。完美的情况是,高标记模型的性能清晰,良好,而现实世界是每个人的天才。据我所知,勘探行业中应该有很多人使用模拟器,或者是第三方评论标准,例如戒指般的竞争。我认为这些也是夏娃的一些探索Ryone从这个困难的问题开始。图像来源:CCTV.com Hongjun:我看到中国举办了体育赛事和第一个机器人展览。机器人显示了许多功能,例如踢足球,赛车和执行一些特定的任务。如何判断机器人,其技术是好还是坏?你能从这些演示中分辨吗? Wang Hao:我认为这有点困难。每个人在我们体现的领域中都会感到困难和痛苦。在评论中,很难在评论中拥有一个大小的标准,可以防止每个人都检查较便宜和公平的模型。最好的评论是去现实世界进行检查,但是我们很难建立一个公平的竞争领域,因此这是一个很难的地方,但我认为仍然有几种检查方法。例如,我们有一批开放资源模型。您可以查看不同模型在自己的机器人本体论中学习相同活动时所需的数据量。一般能力和reaso可以评估它显示的。此外,对于不同的机器人公司,它可能是理性和公平的:我们将其机器人应用于特定情况,以查看不同的模型的性能。因为在现实世界中使用时,它表明区别在于,概括或环境是非常随机的,因此最好反映模型的功能。 02数据挑战和硬件瓶颈Hongjun:仅提到的贫困,凯提到了第一点。其他两个点是什么?即使在2025年的今天,脚也无法实现这一目标。如果您希望数据质量很高,则需要仔细设计和清洁。例如,大语模型中的培训也对数据质量非常敏感。我们使用机器人进行的数据是由我们自己收集的,然后清洁的,每个细节都应到位。当您需要追求细节时,很难追求更高的数量。所以问题LEM是,我们变得越来越需要,并购买数据以使我们的模型变得更好。第三个困难是保持真实的机器。那些与机器人一起工作的人,尤其是那些试图制造真正的机器人的人应该热衷于这个行业,但是我认为维护真正的机器人硬件是非常令人鼓舞的,尤其是许多新手。当我看到他们开始学习机器人时,我会看到没有更好的机器人可以手工使用。它可能不像某些纯软件行业。您可以下载一些代码并直接运行机器人。直到今天,仍然没有每个人都认可并愿意拥抱的硬件平台。无论硬件是什么样子,行业仍在争论和探索。我认为这些条件为我们的研究和领域提供了一些门槛。开源机器人数据集,照片来源:打开X-Embodiment Hongjun:是的,当涉及到这一点时,我会考虑的,有时我会与机器人研究人员聚集,每个人都问我白天在做什么,那就是我一天什么都没做,我专门从事手训练,因为我的手不太稳定。 ke我当时还很年轻,想到了:哦,为什么整个机器人项目持续下去?当我对自己做这件事时,我发现我每天都在尖叫。 Hongjun:我认为Dataito非常重要,而且我也知道,您的独立变量机器人模型Wang Hao已经累积了数千个多模式数据。好吧,您刚刚提到了π模型。您说您必须收集高质量的数据,然后您需要自己收集和清洁数据。 KE由于大语模型的成功,一切都对数据质量更敏感。 Hongjun:您是自己收集数据还是在第三方公司收集数据? Ke Li Yiming:我们自己收集了很多数据。 Hongjun:业内是否有一些特殊的第三方公司来提供数据? Ke Li Yiming:我认识一些朋友。他们开始了我自己的企业为机器人提供一些真实的机器数据,但这不是我们当前研究的重点。 Hongjun:您认为多少数据可以产生一个很棒的大YouDelo? ke我曾经和我的朋友聊天,如果某人的生活是100年,那么我们几乎可以计算出100万小时。现在,在我的公共信息中,我似乎没有看到有人在做100万小时的数据。因此,我认为,当我们收到一百万小时的数据等于一个人的身体经历时,我们可以在以后开始探索。如果将来可以在现实世界中广泛部署机器人,则可以收集100万小时的数据,这只有几天。这也是一些朋友的抱怨,他们为他们的行为感到自豪,因为他们为自己的行为感到自豪:我想现在做这项工作,给我400万小时的数据,在下一天的第二天开放和清洁。我说,我已经在机器人上工作了很多年,但似乎并没有o花费400万。图像来源:体力智能Hongjun:为什么您的判断100万小时?我们以前曾说过,当人们成为领域的顶级学者和专家时,有10,000小时的规则。除了我的宝宝学会吃饭的事实外,他不确定他什么时候还很年轻,但是他学会了这一天。但是,为什么机器人比人需要更多的数据来训练灵活性呢? Ke Li Yiming:我有一些粗略的想法。当我们独自研究时,有一个名为跨流离失归迁移的焦点中心,希望在不同形状和类别的机器人中收集的数据可以应用于其他机器人,以便可以更快地学习任务。人们这样做的能力可能与基因和身体有关。毕竟,人们有一个非常有用的感知,这就是眼睛。现在,没有相机敢于针对人眼和我们的关节。这些物理和自然的事物是人类行动的基础。我个人b阐明可以使用一些算法的优势来克服硬件缺点。但是罗马不是一天建造的,我们不能指望机器人是婴儿后会很快学习。如果机器人想快速学习新任务,那么您仍然需要积累很多。 Wang Hao今天提到的,我在PI中看到的是某些机器人中收集的某些任务数据将更好地完成任务,因此新任务可能不需要大量数据。 Wang Hao:实际上,如果您比较人,我认为机器人仍然不公平。主要的是人们确实拥有“预训练”。在整个生物世界的巨大演变过程中,有两个非常基本的观点:一个是,在进化过程中,人们积累了许多以前经过验证的物体,例如了解世俗的接触和应对物理世界的技术,实际上是用基因写成的;另一方面,人们确实在改变自己的硬件和整个Biolo基督世界就是这样。如果您用“明智”解决问题,并尝试使用“硬件”来解决它们,那么许多生物都会改变某些结构,例如ASE。大肠杆菌,不必眼睛。只要您对化学和温度敏感性有一定的了解,就可以适应周围环境。我们现在做事,这是为了帮助机器人制造其实践前模型。尽管它似乎涵盖了人类进化的数百万年方式,但确实有所不同。首先是机器人可以执行大型复制,并且各种机器人可以共享他们的经验,以便我们可以快速开发一个预先训练的机器人模型,从而有能力看到和理解物理世界。当然,这个过程使机器人更熟悉其身体。正如凯今天所说,我们制作了不同的机器人(模型),以适应不同的身体,并允许他们看到其身体的差异。非常好心。第二,在人类研究中,仍然有M所谓的10,000小时理论中的任何变化。人们在一段时间内没有专门学习这项工作,他们将在完成研究后知道下一个新任务。当您开始教宝宝做某事,例如获得某些事情时,它可能还不够准确,并且不确定地理解它,因此您扔了这件事,而忽略了它,与其他玩具一起玩,开发块等。一个月后,您知道他不会花很多时间研究获得某些东西的任务,但他学到了它。它还反映了人们从学习过程中学习并联系环境,这实际上是并行研究中的多任务。它可以从各种活动中意识到基本的,唯一的物理结构,这将有助于减少学习新任务时所需的数据量。因此,现在我们在练习机器人时也这样做。我们使用尽可能不同的数据以及具有不同能力开发大数据系统的活动M和机器人功能。也许在学习新任务时,所需的数据量将减少。所以我只是说机器人需要数百万个数据小时。核心是解决两个问题。首先是长期以来涵盖人类进化的前训练过程。我们需要浏览许多这样的数据,可以帮助机器人发展这种基本能力。第二是,在学习新任务时,我们还应该使用在编写旧活动中产生的这种一般能力,以便可以将它们推广到新功能中。因此,就数据和时间而言,我们不能完全将自己与人进行比较,但是我认为这个研究过程以及背后看到的规则可能是相同的。图像来源:自变量机器人 - 一个体现智能基本模型墙-Oss Hongjun的开源:我想知道您在现实世界中收集了多少数据?练习迎接模型时,数据要花多少钱?或数据的效果如何?虽然π₀waS出版,PI仍然很年轻。我认为这确实显示了两件事:第一个是Puthat时间收集的数据量真的很大,此后添加了数据,数据的成本以及实时的数据变化量。当Google Research Institute启动探索时,会有很多努力来接收这些数据,但是后来,逐渐获得经验,收集PI或其他公司变得更加容易,并且应控制和降低成本。 Hongjun:那么您今天使用大量数据综合吗?我知道行业中的许多人会使用合成数据。 Google几周前发布了Genie 3 World Model。我已经听到了两所学校的两种不同意见:一所学校认为Genie 3对机器人来说是值得的,因为该模型中该模型的数据很有用,但是其他学校会认为数据的质量仍然不够。来源NG图像:Google Keli Yiming:我认为它可以BE分为两个问题,一个是我们以前做过的,另一个是整个领域的使用。 π₀。₅必须有一篇文章来探索π₀.₅的实践中的一些训练。注意到,当π₀.₅。我们将一些数据引入网络。我不知道这是否被严格视为合成数据,但是我希望通过引入一些不同的外部知识来给予它一种一般和联合,而不是告诉机器人该怎么做。我认为,关于该领域的合成论文的角色是什么明确的结论。现在,有些人认为,如果可以产生低成本,控制和对机器人有用的大量数据可能会开发出来,但是当今最重要的困难是如何创建这些数据以及如何证明它是有益的。这仍然是一个相对裁切的研究问题。 Wang Hao:当今顶级机器人公司的数据量受到真实的物理世界的限制,所有这些都可以集中在成千上万到成千上万。但是,与GPT-4培训模型相比,数据量甚至更小。除了使用机器人最重要的现实世界数据和数据外,我们还将使用其他一些数据,但是每种类型的数据肯定都会有您自己的问题。机器人的真实数据非常昂贵。由于机器人硬件站点,操作员的收集速度等,每个方法都有许多改进方法。他们不仅可以依靠真正的机器人身体,而且还可以制造一些便宜的体,即使没有必要产生完整的身体。只能收集一些可穿戴的传感器设备。实际上,我们还使用了许多生成模型来产生合成数据,但是合成数据在很大程度上减轻了视觉和现实之间的分布差异。很难通过物理接触过程产生数据,这种类型的数据仍需要在现实世界中收集。还有另一种类型的数据H是人类视频数据。这个量表是压倒性的,有很多差异,而且成本相对较低。我们还帮助许多公司探索它。但是,仍然很难依靠这些数据来帮助机器人生成动作水平。浮雕模型现在从视频数据中从作用中学到了什么。已经发现了人类视频中一些先进的语义理解和计划工作。但是,这项计划是通过视频而不是语言来学到的。与Genie 3一起,我认为这是一种很好的工作方式。它从互联网和游戏环境中获得了大量的高质量数据。因此,通过视频生成,您可以对动作进行一些控制,这是将来的好方向。尽管与现实相比,这种环境有点简化,但仍可以用作培训环境来帮助您进行这种联系。因此,我们仍然与数据有关。我认为每个公司对数据的投资可能是不同的。这也取决于整个公司的整体强度,例如运营功能和硬件级别。各种数据使用计划将使您的数据成本不同。与美国相比,硬件成本和人工成本可能有很大差异。即使在同一地区,操作能力,数据过滤,清洁,发电和分配,在不同情况下的数据收集功能,情况快速构建和恢复功能也会影响数据成本。 Hongjun:因此,可以将您公司的数据成本与其他机器人公司进行比较。估计水平是多少? Wang Hao:这很难在不同公司之间进行比较,因为每个人对数据质量和差异的要求都可能有所不同。但是对于我们公司而言,数据应占整体研发成本的很大比例。图像来源:自动变量机器人Jun:今年9月8日,您的开放式开源模型启动了。请bRiefly向您介绍您的开放资源模型是什么?其行业的特征是什么? Wang Hao:我们继续运用开放资源的精神并吸收了很多经验,因此我们使用了大约数千次现实世界数据来培训具体的基本模型。我们的概述是一个概述,因此可以用来牢记链条或手势。我们已经根据训练有素的视觉语言基本模型扩展了这一点。这就是我们注意到的。当前,仍然缺乏体现的开源模型。我们还希望此时,开放资源可以为具体的智能行业提供更好的补充,以便每个人都可以更好地使用我们的基本模型来制作一些长期任务并解决一些复杂的任务。为了解决这些长期任务,我们需要更好的语言合规性,更好的空间和推理推理。我们还希望我们的端到端推理,计划和模型实施模型可以发挥作用和社区用途。洪Jun:那么您的模型的重点是什么?我认为行业中模型参与者的方向是不同的。例如,有些人专注于精细的操作,因为Google非常擅长折纸动作,而PI希望在一般将军中具有更强的能力。如果您在句子中总结了您的优势,您认为机器人领域最关心的观点是什么? Wang Hao:我们最关心的是机器人的一般将军和解决长期活动的能力。解决长期任务意味着它应该具有相对强大的能力,因为解决任何长期任务都将处理不断变化的情况。这项工作可能会遇到以前从未见过的各种失败和不同的操作对象,因此需要具有强大的一般普通。 Hongjun:例如,对于长期而复杂的问题,请给我一个例子。图像来源:自变量机器人 - 具有GEM的开放资源墙 - 王霍的智能基本模型:实际上,实际上,我们在任何情况下都使用机器人,这是漫长而复杂的。例如,如果我想彻底清洁餐桌,那是一个漫长而复杂的性,因为您需要操作多种类型的事情:您可以跑步困难的东西,例如餐具;还有一些需要操作的液体,例如在固定区域倒入食物和液体的残留物;您还可以对许多不规则物品(例如废物和残留物)进行处理;需要处理许多灵活的物品,例如擦拭桌子,折叠毛巾等;可以将不同的东西放置在不同的位置,您应该更加谨慎处理可能的溢出或其他情况。因此,在清洁餐桌的任务中,它不会执行固定订单。首先要做什么,以后要做什么都散布在漫长的任务中。人们真的很难拆分E的EACH任务。这种类型的任务应由端到端模型独立决定并实时计划,并且整个任务已完全完成。 Hongjun:然后在您的实验室中,评估机器人活动的完成时,实际培训是什么样的培训? Wang Hao:尽管我们的实际培训还包括其他一些情况,但它主要基于家庭场景,因为家庭场景确实包含了智能需要解决的所有活动。就像清洁整个餐桌,餐具装饰,清洁整个浴室并清洁房间一样,这都是我们所有的培训任务,我们发现机器人正在处理这些长期任务,提高操作能力,并且通常可以看到,这确实可以增加我们的Kumbail。我们还希望使用独立变量的开放模型,让每个人在求解当前基本模型中发现的功能,例如漫长的活动。 03型号ARChitecture和技术路径Hongjun:我注意到,如果是PI或自变量,它们都会产生开放的资源。您为什么要进行开放资源?在整个生态系统中,开放资源的好处是什么? Ke Li Yiming:我认为可以在行业和社区中分享该模型,并帮助每个人快速开始。这也可能是机器人模型研究的障碍物进入的伪装减少。实际上,在公司内部,开放资源也是一个过程(研发),它将决定开放资源,并将所有内容用于重塑新发表的研究,然后进行测试,然后与一些社区开发人员进行交谈,以查看他们是否可以运行。这不是一件简单的工作,但是我仍然喜欢看到我们的模型在我们没想到的一些机器人上运行,而其他人可以使用我们的模型进行许多不同的实验。现在每个人都很乐意开放资源,我认为这是一个很好的氛围。图片来源:X.com HongJ联合国:我看到你喜欢机器人。 Wang Hao:我一直觉得开放资源是一件非常重要的事情。开放资源意味着我们可以站在巨人的肩膀上,并继续前进。我们可以根据现有成就进行更多改进,而KO开发人员的评论也将帮助开放资源公司。公司的开放资源可以从中学习,然后考虑这条技术途径。普通的大学或小型企业可能无法制作基本模型,但是如果它们可以使用这些基本资源,它们可以制作应用程序,在各个方向上使用它们,并丰富整个生态系统,这也是非常重要的事情。我认为AI研究与以前的大型模型不同。过去,我们已经看到对AI和大型模型的研究非常离散。在建立社区之前,只有两个或三个人正在研究。所有疯狂地研究算法,并且优先级是出版论文,目的是采用主动性基础技术。但是,在社区和整个开放资源系统中,所有人的关心是如何在工程系统下为该项目奠定坚实的基础并使社区更加繁荣?个人如何为社区做出贡献?所有的荣誉来自这些事情。它还将激发开放资源技术的持续发展。因此,我认为开放资源是一件很棒的事情,您可以从中学习新事物,您还可以看到您的事情可以帮助他人。 Hongjun:您认为公司判断今天模型质量的主要因素是什么?现在,我们不仅要与它们收集的数据的质量竞争,而且在模型层中也有许多不同的技术路径,例如If IfferAre We高频控制方法,或者如果我们使用System 2+System 1 Tem Architture的两个系统?您能谈谈模型层上的不同技术途径以及您的操作方式吗t?图像来源:自变量机器人开放源体现的智能基本模型Wall-Ok Wang Hao:从独立变量机器人公司的角度来看,我们非常坚信,建筑驱动的驱动驱动驱动的模型的构建方式。我们打开了墙壁模型资源,该资源也基于此体系结构构建。无论您是语言,视觉还是行动,有多少方式,都必须在同一空间中代表和对齐。铺设是他们的不必要因素,因此我们应该避免尽可能多地由人类分层引起的信息。但是在Corneronly中,如果您已经训练了端到端,则可以制作型号,并且可以实现数千亿或数十亿美元的矩阵模型。如果我真的想使用它该怎么办?不可能将如此大的模型部署到最后,因此当推理时,我们认为模型可以分开,并且可以放置较慢的任务过程d在云中进行处理,可以将更快的工作过程放置在物理侧,然后梯度后通路更新整个系统参数。这个过程非常重要。 Hongjun:我们说,两层建筑模型与人脑的大脑和小脑非常相似。例如,一层负责理解和计划,另一层负责高频输出控制,例如管理理解和决策的大脑以及管理运动控制的小脑。您为什么不使用架构? Wang Hao:我们是端到端的培训。很难将某些参数完全划分为模型中的系统2,例如将某些系统分为快速系统,直观系统等,但是我们可以训练大型的端到端模型,该模型可能具有非常强大的通用能力,从而允许体现的通用能力能够结合相同的理解一定的理解d推理和产生行动。但是,您确实可以在部署时有很多方法,例如约会和压缩良好行动的零件,然后将零件放在云中的语言推理和视觉推理等方面。那你是怎么做凯的?图像来源:物理智能Ke Li Yiming:我们仍然愿意思考。我们认为机器人模型还没有像GPT-2那样到达。我们希望尽快达到此水平,但是现有模型和性能中仍然存在一些差距。数据驱动的算法是我们最关心的内容,但是我们如何设计这种特定的算法?如何开发模型体系结构?如何设计硬件系统?您如何收集数据?我认为一切仍然用于数据驱动的服务。 Hongjun:因此,它将两个部分的推理和控制分开,还是这是完全集成的端到端解决方案?你墨水这确实不是目前最重要的问题,也许是Onesg的道路还可以,我觉得当今机器人模型整个领域的每个人的技术道路似乎都是团结的。 Ke Li Yiming:我认为这句话非常有趣。最近,当我和大三的晚餐时,我仍然在谈论这件事,因为大约三到四年前,我们会感到整个行业都发生了变化。学术界以前更加分散,而关注的方向,思想,算法和问题也不同。今天,自视觉语言动作模型诞生以来,它已经变得流行,许多人都遵循,使我感到更多的方面已经开始转变。 Hongjun:您认为场景在哪些方面表示?从哪些方向是相同的方向?这是什么意思? Ke li yiming:其中之一是对模仿的研究。我在2018年开始进行模仿研究。当时,我几乎没有Nddustrial的研究,几乎没有研究要遵循。那时,我认为这是一个不那么主流或流行的想法。我看到了2018年的波士顿跳跃。毕竟,即使人形机器人跳跃直接用于模仿研究,但挑战可能有些困难。该行业中的许多人会说,当他们在1960年开玩笑时,我们的机器人将人们送到月球,机器人正前往火星。这是成功的机器人的方法,它已成为火箭纪律。只有机器人研究人员从未学会过如何成功并仍然与这里的机器人一起工作。虽然这是个玩笑,但也表明,该行业中有一系列接力赛探索,包括探索2000年的自动驾驶,以及背后的人形机器人以及波士顿动力学领导的力量。在2000年代初期,有一个真正的柳树车库,这是美国学术社区的一个相对流行和流行的开端。那时,EY推广了一个名为PR 2的机器人,该机器人也被认为是移动祖先,但不是人形机器人。因此,从过去,我认为所有研究的方向都不同。有些人制造汽车,有些人牵手,这在机器人行业到处都分散了。如今,由于大型模型的流行,它强调了模型的可用性。许多人开始怀疑他们是否可以结合这些东西。这是一次非常友好的相遇。柳树车库,图像来源:商业内部人士Hongjun:我在业内看到,从企业家的角度来看,人们之间存在许多差异。例如,有一个脚步机器人,一个人形机器人独自行走。还有一个轮胎机器人,它可以专注于手动操作,只能用轮子滚动行走部分。许多公司还想知道,我可以有一个可以同时工作上半身和下半身的机器人吗?因为许多机器人可以具有上身或较低的机器人身体,但通常每个人都希望使模型更大,并且功能更具用途。现在一切都很开放,会问我们是否应该尝试视觉Wika的大型模型。您提到的上半身和下半身的形状确实是这样做的。 Hongjun:Kay认为整个机器人模型甚至都不处于GPT-2级别。您如何看待Wang Hao? Wang Hao:我认为它已经达到了GPT-2水平。在这种类比中,GPT-1通常是该概念的证明,可以通过预训练和增加数据来处理某些任务。但是在GPT-2时,我们开始验证其规模的力量。通过显着增加模型参数和培训数据,我们可以显示量表带来的能力的提高。也许如果我们制造更大的尺寸,我们可以达到GPT-3级别,每个人都会看到许多能力出现,所以我认为现在是这样tage gpt-2。我们通常知道规模是唯一的可靠路径,因此在此阶段,我们应该不断地积累数据,改善模型的大小,并开发支持体现智能的各种基础架构。因此,有点旨在说类人机器人目前处于GPT-2阶段。图像来源:自变量机器人 - 开源是体现的智能基本型号wall-ok hongjun:那么您认为机器人字段需要到指定的GPT-3时刻需要多长时间? Wang Hao:现在,我们正在谈论机器人领域的GPT-2到GPT-3。从语言模型的角度来看,存在差异。当我们使用语言模型时,我们不知道该路线是否可以完成,并且中间有许多分散的探索和收敛过程。现在,我们清楚地知道并看到了这个量表带来的进步,因此,对我们来说,路径和目标更清晰,更独特,因此Hinui猜测我们在1中达到GPT-3级别到2年。 Hongjun:非常快,需要1到2年。我注意到,在美国,当我们谈论机器人时,我们都想做这种通用机器人,然后用大型模型进行。如果将其与自主驾驶进行比较,那么美国希望进行L4和L5水平的自主驾驶水平。但是,当我们看到中国发展的方向时,我会感到很多小而独特的商业路线。例如,当中国公司进行自动驾驶时,他们认为他们可以在公园或码头中实施这种情况来创建一个非常contract的小型和独特的行业。您如何看待两种机器人方法和行业发展的最终结果?哪个路径位于? Wang Hao:我认为应该与他们对中国和美国的好处相结合,以查看这个问题。实际上,无论费用如何,美国目前的道路都是自上而下的。他们将优先制作超级大型型号附近的Agi。在拥有这个基础之后,他们将考虑如何做。这也是美国具有计算能力的好处的原因。顶级芯片和最大的计算功率簇都在美国,因此该路径更倾向于使用无尽的计算能力来探索功能的边界。但是中国对芯片有一些限制,因此它迫使中国公司研究和思考如何通过计算的限制力量来实现更高的效率。但是,我不同意中国公司现在采取一条小而准确的技术途径。中国确实在移动中最大的情况适用于全球互联网生态。这种情况的优势和中国在硬件领域具有完整的工业连锁店,这与美国不相容。实际上,中国有许多领先的研究机构和出色的创业公司,他们一直在想从第一原则的角度来看,并了解规模的法律。这确实是AGI的唯一方法。我们坚信,应该有一个强大而强大的基本模型来在不同的领域使用此基本模型,并可以更好地部署它。但是,这个过程并不震惊。它应该有一个庞大而庞大的基础,要有一个小小的精致发展。就实施道路而言,中国确实就像是上下双轨并行性的结合。一方面,请考虑尽可能多的方案,尤其是这种一般情况可以带给我们的情况,同时它将迭代我们自己的一般基本模型功能,以便机器人可以更快地在现实世界中获得更好的反馈,帮助每个人都实现业务封闭循环并开始开发数据飞行器。图像来源:Hongjun,一个自变量机器人:那么您个人想创建一个通用模型吗? Wang Hao:是的,我们将确定y制作通用模型,这非常重要。 Ke li yiming:我认为双方的厚度生态学都有许多历史因素。一方面,国内经济正在迅速发展,并拥有足够的经验。有许多业务成功会导致公司的安全和公司的商业化,这激发了国内商人从解决问题和解决用户需求开始。因此,许多人会加深他们的领域。以前,我看到了一个中国除草机器人在互联网上“杀死”这个欧美家庭。看到这一点后,我觉得我推荐给我的朋友。我认为中国公司非常擅长进行这样的商业化。同时,中国制造业也存在,机器人对硬件的需求很大。在此阶段,对于商业需求,国内硬件的定义没有任何比较。因此,在当前的国内生态系统中,许多人开展业务,而nesuring业务成功,同时进行其他探索。我在那之前说,我很幸运能成为我毕业的人,因为如果我两年前毕业(也许我不会继续这样做)。当时,许多朋友(早期毕业)擅长机器人研究,但他们都改变了职业,转向了大型语言模型和强化研究。制作机器人将帮助您锻炼技能,但这不是机器人本身。与其说许多美国公司制作大型和一般的模式,不如说这个季节恰好在2024年让我们在新年中,一群Tedao出现了,他们相信这一道路。这个同步因素也与OpenAI在整个行业的理解和震惊有关。直到今天,当我加入PI时,我与他们谈了是否要这样做。我问:您可以成为机器人类型的人吗?如果您想成为一个人,您是否必须燃烧很多钱?如何沿着道路行走?如何商业化?这个合作如何Mpany生存吗?从商业的角度来看,尚不清楚,所以我叹了口气,这些公司真的很少见。有时间可以建立,有人可以相信他们可以做事。在这样的公司出现之前,实际上,美国行业中有许多机器应用公司。其中,其中之一可以与我们公司更受欢迎,长期关系是协变量的机器人技术,该机器人是由伯克利一位非常著名的教授建立的。这些人的交易者经验激发了后来来的人。由于外界的眼睛,协变量深深地参与了商业点,因此它是商业化的,但不如一般。我们公司的最大目标是被数据概括和驱动,因此我们谨慎地避免进行一些短期业务项目。有这样的历史因素导致公司当前的生态系统。图像来源:协变量机器人学:我知道协变是Rea比研究模型更多地是关于敏捷的。基特还说,他们想在现实生活中进行普遍普遍的普遍学习。当然,这可能是因为他们在物流上太成功了,所以每个人都记得自己的其他外观。 Hongjun:他们还研究了通用解决方案和模型水平解决方案吗? KE今天的许多公司和研究人员都受到他们的经验的启发,并选择走上当前的道路。 04商业和登陆前景Hongjun:我认为,当每个人都在研究机器人时,他们希望机器人可以帮助每个人做一些家务,例如折叠板,折叠衣服和洗碗机中的碗。您是否认为将来会有这样的家庭机器人来帮助我们做家务?您认为需要拥有这样的通用机器人需要多长时间? Wang Hao:做家务似乎很简单,但我认为它可以用作图灵测试的理想机器人。因为这个过程将所有精美的动作都包含在宝石智能RO领域机器人,例如切蔬菜,需要适当控制力;一些脆弱的事情应该得到丰富的处理。还有一些长期计划,例如阅读食谱以烹饪,阅读说明以使用特定工具以及处理各种意外情况等,通常包括所有机器人挑战。为了彻底标记这个层次,我们仍然应该采取步骤。在我看来,两三年来,我们可以让机器人在半结构化的环境中做一些简单的事情,例如仅限于厨房,帮助您制作一些简单的菜肴,洗碗等。我认为它们还可以,但是如果我们想在一个完全开放的厨房里做所有事情,我认为这将花费近五年的时间。图像来源:自变量机器人Hongjun:将近五年的时间,我可以在厨房做饭和清洗机器人吗? Wang Hao:是的,我认为可以实现这一目标。但是当时仍然有很多情况都应该忍受。例如,尽管各种活动中机器人的成功率相对较高,但它不是100%,而且仍然存在错误。因此,如果我们允许与人一起工作并从人那里得到帮助,我认为我们可以进入家庭5年。我现在有点乐观,因为我认为机器人领域的发展是正确的道路。有了诸如规模定律之类的快节奏法律,我很幸运能够成为人类历史发展,因为有一条清晰的途径可以告诉我们如何做:只要您投资了功率和组成数据,迭代模型架构以及改善机械能力,您就可以通过肉眼来改善机器人的改善。因此,即使今天有很多问题,这使我们感到高兴,如果您将其查看5年,它也可以解决,并且该模型肯定可以越过门槛并进入新阶段,因此我预测5年的时间非常合理。此外,tuin五年的时间,我们需要更加小心,因为机器人不允许轻质资产快速重复像纯软件一样重复。机器人仍然受到物理世界的物理定律的限制。如果需要开发硬件,它们还应打破各个方面的数据,算法,供应链,业务模型和其他因素,以真正实现这一目标。 Hongjun:我认为这是一个非常大胆的预测。 Ke Li Yiming:我认为应该在5到10年内实施。该模型和算法的当前技能显然并没有达到“我们可以通过商业化来制造产品”的地步,但是行业的速度确实很快,并且以所有人的热情和投资,我相信在两三年中,甚至每年都会有一个新的变化。此外,我们专门的智能行业与传统的机器人行业(例如自动驾驶甚至火箭攀登)确实不同。我们可以像扫地机器人一样,他们是第一个扫荡不完美的机器人,用户nEED了解他们可以做和不能做什么。这是一个更好的商业模型。为此,我保守地估计,生产这种产品需要5到10年。它可能会不时犯错误,但是它犯的错误在用户的范围内,这也可以是帮助用户的产品。我有事要问。一些机器人公司旨在“工业化”,并希望制定一些商业应用。您应该如何考虑这些公司的商业化和研发?图像来源:自变量机器人王霍:我认为这个问题很好。从第一天开始,我们就一直在思考,我们俩如何寻找星星并扎根?对于实际因素,不可能实现AGI然后考虑商业化。我们当前的方法是尽可能根据我们的整体模型进入某些情况。这种情况应该相对靠近一般场景您想实现并可以衰减的Ario,因此我们尽量不要触摸尽可能紧密的情况。老年人照顾公共服务和服务等场景非常好。这种情况与通用机器人的最终应用情况有一定的相似之处。它们可以参与一些复杂的任务,例如与人互动,并且还涉及更复杂的任务,例如清洁,选择对象,处理组件等。从这个角度来看,这些都是美丽的场景,因为它们接近最终目标,您也可以继续缩回和测试这些情况下的一般模型的功能,并且您可以得到非常重要的回馈。但是,要保持这种最初的选择意图,拥有商业路径的坚定决心非常重要。另一个更重要的是公司组织的能力。因为公司组织的组织和组织能力生病确定公司的上限。我认为该公司应该使用通用模型和基本模型Bilaof的目的,并实现一个没有障碍和良好协调的组织,以便您在中间犯的每一步都不能犯任何错误,并最终使您能够实现最终目标。 Hongjun:因此,您要注意是否可以将培训方案应用于商业,而不是在封闭的情况下可以实现的要求。我们刚才提到的家具机器人可以帮助我们烹饪,洗衣服并折叠被子。是否可以将这种情况使用具有足够销售的机器人来支持机器人公司? Wang Hao:我认为这很有希望。由于整个机器人行业的规模并没有增加,因此仍然有足够的空间来降低硬件成本。在提高模型级别和降低硬件成本时,几年来的价格将使用户更容易接受。第二,从TH的角度来看是功能,如果我们可以帮助普通用户做很多事情,那么一切都会很乐意接受此类产品。今天,每个人都很难接受机器人,因为机器人似乎在跳舞并伴随着他们的情感价值。他们似乎没有其他操作。过去,机器人没有机会向普通用户展示不同的应用程序,但是将来我认为有很多机会可以展示它们,还有很多想象空间。回到Sohu看看更多

服务支持

我们珍惜您每一次在线询盘,有问必答,用专业的态度,贴心的服务。

让您真正感受到我们的与众不同!