在大模型浪潮中锚定AGI
阶跃星辰重视多模态模型的发展,认为其有两个重要趋势:一是预训练加上强化学习,激发模型推理时产生长思维链,提高推理能力,如阶跃星辰发布的推理模型Step R-Mini;二是多模态理解生成一体化,即将推理引入多模态领域,使模型能根据更多特征信息给出更准确答案,该探索已延伸到短剧审核等领域,大幅提高审核效率。
姜大昕认为AGI的实现路径越来越清晰。回顾技术发展路线,从2017年transformer架构的出现,到2020年GPT-3将海量互联网数据放入可扩展架构,再到2022年ChatGPT在预训练模型基础上加入指令跟随,语言模型技术路线已基本收敛。姜大昕相信视觉模型也可遵循类似路线,通过海量视频预训练、加入指令和推理等,最终实现世界模型,即AGI。
2025年被视为Agent元年,其爆发条件包括多模态能力和慢思考能力的突破。阶跃星辰发力智能终端Agent,投入重兵,目前主要精力集中在AI手机、智能汽车、IoT设备和具身智能四个方向,与OPPO、吉利汽车、TCL、智元机器人等合作。姜大昕描绘了未来家庭场景中智能终端的便利性,并用三点概括阶跃星辰的发展蓝图:坚持基础大模型研发、突出多模态能力、发力智能终端Agent方向,形成从模型到Agent、从云侧到端侧的生态体系,目标是让智能体从数字世界走向物理世界。