新浪科技讯 3月18日下午消息,昆仑万维(维权)正式开源首款工业界多模态思维链推理模型Skywork R1V,即日起开源模型权重和技术报告,成为中国第一个开源‘多模态推理模型’的企业。
昆仑万维官方表示,Skywork R1V在训练过程中创新性地采用了三阶段方法,使得文本端强大的推理能力得以高效迁移至视觉任务上:第一,视觉语言表征的初始对齐;第二,推理能力迁移;第三,视觉与文本模态精准对齐。
通过以上训练策略,Skywork R1V在视觉推理任务上取得突破性进展,并在多个公开评测基准中达到或超过了现有领先模型的性能。(张奥)

海量资讯、精准解读,尽在新浪财经APP
责任编辑:何俊熹