扫描二维码

订阅kaiyun体育官方人口 微信

阶跃星辰姜大昕:多模态大模型将走向理解与生成的统一

来源:北方企业新闻网  
2024/7/8 16:48:33
从模拟世界,到探索世界,再到归纳世界,多模态是贯穿这三个阶段的基本能力。

本文关键字: 大模型

2024世界人工智能大会启明创投·创业与投资论坛近日在上海举行。阶跃星辰创始人、CEO 姜大昕博士受邀出席此次论坛,并发表了主题为《攀登AGI的路径与实践:万亿参数和多模融合》的演讲。在演讲中,姜大昕重点阐述了一个核心观点:探索AGI路径,“Scaling Law”和“多模态”是相辅相成、缺一不可的两个方向。两者齐头并进,最终到达AGI。

阶跃星辰进一步强调,多模态是构建世界模型的基础能力,是通向AGI的必经之路。从算法角度看,世界模型的演进会分为三个阶段:

第一阶段是模拟物理世界;

第二阶段是通过具身智能和物理世界交互,主动探索物理世界;

第三阶段是通过发展系统能力,发现新的物理规律,归纳物理世界。

从模拟世界,到探索世界,再到归纳世界,多模态是贯穿这三个阶段的基本能力。目前,全球科技巨头正在积极探索并布局多模融合的路径,多模态大模型研发的脚步正越走越快。然而,多模态领域目前存在的问题是,视觉的理解模型和生成模型是分开发展的。其造成的结果就是理解模型的理解能力强而生成能力弱,或者生成模型的生成能力强而理解能力弱。因此,多模态大模型接下来面临的一项关键挑战,就是能否将理解和生成统一在一个模型里。

目前,阶跃星辰正在朝着这个方向努力,并取得了一些阶段性的进展。在 WAIC 2024上,新升级的Step-1.5V千亿参数多模态大模型性能大幅提升,具备更出色的视频理解能力;新发布的Step-1X图像生成大模型,则是阶跃星辰首次推出多模态生成大模型。


责编:畅享精灵
vsharing微信扫一扫实时了解行业动态
portalart微信扫一扫分享本文给好友

著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
畅享
首页
返回
顶部
×
    信息化规划
    IT总包
    供应商选型
    IT监理
    开发维护外包
    评估维权
客服电话
400-698-9918
Baidu
map