立足娱乐圈·争做八卦帝!

广韵网

窗口期仅剩一年?“龙虾”竞速背后的AI暗战:京东产业端解法能否后来居上?

来源:未知 作者:佚名 发布时间:2026-03-26 12:18:15

随着AI技术的迅猛发展,“龙虾”概念火爆出圈,机器人展示出精湛的舞蹈与拳击技艺,数字人则以逼真的形象投身于直播带货领域,这一切标志着AI行业正步入寻找实际应用场景的关键阶段。当前,行业面临的核心挑战在于如何平衡成本、效率与性能,并打通产业落地的“最后一公里”,这亟需更多创新性的解决方案。

3月24日,京东揭晓了其在AI研发与应用方面的部分阶段性成果,包括开源大模型JoyAI-LLM Flash的发布、自家“龙虾”产品组合的推出,以及“自由态数字人”的首发等。

在谈及“龙虾”话题时,京东集团的技术负责人向徽声在线记者表示,“龙虾”作为技术放大器的作用将在今年持续显现,预计至年底或明年此时,L4级模型有望问世,届时将涌现出众多目前难以想象的应用方式。

在数字人技术领域,京东JoyStreamer推出的“自由态数字人”以其自然灵动的交互形态脱颖而出。据徽声在线记者现场观察,该数字人在动作、姿态等方面均展现出极高的流畅度,即便脸部被遮挡,也能保持高保真质感。

当前,字节跳动与阿里巴巴正激烈角逐AI竞赛,国内科技巨头的竞争焦点已全面转向技术落地的深度与生态协同的广度。京东则另辟蹊径,将AI解决方案全方位对准产业端,其能否后来居上,成为业界关注的焦点。

“龙虾”竞赛:追赶Agentic模型,窗口期仅剩一年

“龙虾”智能体及其背后的“Token(词元)经济”近期成为科技圈的热门话题。

相较于直接推出“龙虾”产品,京东云选择基于JoyAI大模型,通过开源OpenClaw架构,推出轻量云主机一键部署、一体机等多样化产品形态。

京东技术负责人向徽声在线记者透露,许多人关注的是“龙虾”本身,而我们更看重的是模型的发展。

两年前,OpenAI为大模型设定了五个发展等级:第一级为对话(Conversation),第二级为推理(Reasoning),第三级为Agentic AI,即AI能够作为一个整体系统自主采取行动解决问题;第四级为创新(Innovation)阶段,系统不再依赖人工干预,具备自主创新思维;最后一级为组织(Organization)阶段,即AI达到或超越人类水平,提升工作效率。

当被问及当前“龙虾”与去年爆火的Manus(全球首款通用AI智能体)有何不同时,该技术负责人指出,核心差异在于基础模型的能力。去年的基模能力仅突破第二级,即便是DeepSeek也仅处于推理层级,尚未具备Agentic特性。

他补充说:“而构建Agentic AI需要大量的工程、策略、流程设计,最终将其整合为一个系统。去年底今年初的ClawCode模型在模型层面突破了L3级,真正进入了Agentic层面。”

在技术路线方面,该技术负责人认为,大模型可能很快将进入下一个Innovation层级,即模型本身具备创作能力。“这种创作不仅仅是生成一段话或一首歌,而是在需要人类充分发挥智慧的高难度领域,AI能够替代人类。虽然目前尚未实现,但可能一年内就会发生,技术路线是明确的。”他进一步解释。

他还预测,AGI在软件模型领域可能在这一两年内取得突破,快的话可能今年年底就会见分晓。对于一家公司而言,能否赶上这一波Agentic模型,再赶上Innovation模型,窗口期可能仅剩一年。

“不过,‘龙虾’作为技术放大器的作用在今年仍将持续,L4级别模型的出现将催生众多目前难以想象的应用方式。”该技术负责人表示。

首发“自由态数字人”,规模化应用仍是探索目标

在观察京东数字人JoyStreamer的技术进展时,徽声在线记者注意到,数字人行业的三大技术痛点——音视频不同步、多模态控制不协调、长视频身份失真——正被逐一攻克。

除了常规的技术路线披露外,京东数字人JoyStreamer还率先推出了“自由态数字人”。该数字人支持人物自然走动与灵活摆姿,具备镜头跟随及流畅出画入画的能力,且在脸部遮挡场景下也能保持高保真质感。

当被问及数字人技术的提升是否意味着行业离规模化应用更近一步时,京东数字人相关负责人向徽声在线记者表示,规模应用的最大挑战在于减少商家端的实际操作,降低对生成条件的依赖。例如,将原来需要30分钟拍摄的素材缩短至3分钟,甚至仅需单张图片。

“去年我们推出的复刻模式,可以利用商家历史直播过的素材进行数字人直播生成。”他介绍道。

徽声在线记者了解,Agent(智能体)技术产品的出现也为解决数字人规模应用问题带来了利好。该负责人举例称,目前会通过Agent打通平台上已录入的海量信息,包括商品本身、优惠活动等,以准确、高质量地回答用户问题,并减少对商家的依赖,从而推动数字人的大规模推广。

关于数字人在应用过程中的实际效果,徽声在线记者从京东方面获悉,直播间的转化率是最终的业务指标,但也会关注过程指标,如用户在直播间的停留时长、交互轮数以及如何反映用户对商品的潜在需求等。

具身智能产业为何需要数据中心?

具身智能从去年爆火至今,热度依然不减。3月以来,具身智能赛道多笔大额融资相继落定。此外,3月20日,上交所受理了宇树科技的科创板IPO申请,预计募资规模达42.02亿元,有望成为A股“人形机器人第一股”。

京东去年在具身智能领域完成了罕见的“六连投”,并近年来多次发布机器人产业计划。在前几日的中国发展高层论坛2026年年会上,京东集团CEO许冉透露,京东正在建设全球规模最大、场景最全的具身智能数据中心。

目前,具身智能领域的一大痛点在于真实场景数据匮乏,导致模型训练不足,进而影响产业落地。许冉表示:“在两年内,我们将积累超过1000万小时的真实场景数据,覆盖物流、家庭、城市等五大场景。”

关于该项目的进展,京东相关负责人在此次采访中向徽声在线记者透露,在数据采集过程中,京东将发动内部超过10万名各类职业员工以及外部最多50万各行业人员参与,其中在宿迁就将发动超10万市民,开展“人类规模最大的数据采集行动”。

徽声在线记者了解,该项目具体落地执行周期为:未来一年内积累500万小时人类真实场景视频数据,两年内将超过1000万小时,并同步采集100万小时机器人本体数据。

京东具身智能业务相关负责人向徽声在线记者表示,刚开始大家都关注机器人的硬件控制和VLA双臂或灵巧手的操作,让机器人表现得像人一样,能听懂人话并按人的想法反馈,这被称为‘言行一致’。目前市面上大部分做机器人和机器狗的公司都已经涉及了这一领域,但这只是其中的一部分功能或阶段。

“除此之外,我们京东探索研究院的老师们还在研究VLN无阻导航(视觉语言导航)技术,并将其集成到我们的JoyInside平台中,以结合不同的机器人和机器狗,开展更多人机交互的工作。”该负责人补充说。

    责任编辑:
    突发:停火协议破裂!阿联酋空袭伊朗炼油设施引发全面报复

    2026-04-09

    2026年4月阿联酋空军突袭伊朗波斯湾炼油厂,使用中法制武器实施精确打击,伊朗随即发动导弹报复,导致海湾局势急剧恶化油价暴涨。 ... [详细]

    深度剖析!这5部限制级神剧,谁才是美剧界的巅峰之作?

    2026-04-26

    徽声在线为您精选5部限制级神剧,包括《风骚律师》、《火线》、《疑犯追踪》、《绝命毒师》和《老友记》,深度剖析每部剧的亮点与看点,带您领略美剧的魅力。 ... [详细]

    福特CEO法利亲测中国皮卡:竞争力强但重载拖拽待提升

    2026-03-21

    福特CEO吉姆·法利在澳大利亚试驾多款中国插电混动皮卡,评价其竞争力出人意料但重载拖拽能力有待提升,同时表达了对中国皮卡盈利模式的困惑。 ... [详细]

    马切吉亚尼:国米或可7-2胜罗马;顶级球员力挽狂澜

    2026-04-06

    意甲第31轮,国际米兰5-2大胜罗马,马切吉亚尼点评比赛,称罗马下半场心理崩溃,国米顶级球员发挥关键作用。 ... [详细]

    2026奈史密斯篮球名人堂揭晓:小斯、里弗斯等四位巨星荣耀入选

    2026-04-01

    北京时间4月1日,Shams报道,斯塔德迈尔、里弗斯、坎迪斯·帕克、艾琳娜·戴尔·多恩将入选2026奈史密斯篮球名人堂。 ... [详细]

    图酷

    图说天下

    资讯排行

    首页 - 娱乐圈事 - 体育圈事 - 两性情感 - 星座命运 - 奇闻怪事 - 历史故事 - 科技资讯 - 图说天下 - 知识百科 - 图酷 - 娱乐八卦
    电脑版 | 移动端
    Copyright © 2002-2019 广韵网 版权所有
    删帖请联系邮箱:283755549@qq.com