云从科技视觉大模型刷新四项世界纪录

速途元宇宙研究院讯 近日,云从科技在视觉大模型上取得重要进展,行人基础大模型在PA-100K、RAP V2、PETA、HICO-DET四个数据集上刷新了世界纪录。其中最高在PA100K上的Fine-tuning准确率达到92.89%,比SOTA高出5.2个点,四个数据集所涉及的范围覆盖人体全局属性(性别、年龄),局部属性(穿戴风格、配饰),携带属性(手机、刀棍、手提包等)、人-物交互HOI(抽烟,持刀棍,手机拍屏幕)等。

云从科技视觉大模型刷新四项世界纪录

上一篇:

下一篇:

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注