华人团队爆火InstructBLIP抢跑看图聊天,开源项目横扫多项SOTA
近日,华人团队开源了多模态基础模型InstructBLIP,是从BLIP2模型微调而来的模型。InstructBLIP模型更擅长「看」、「推理」和「说」,即能够对复杂图像进行理解、推理、描述,还支持多轮对话等。最重要的是,InstructBLIP在多个任务上实现了最先进的性能,甚至在图片解释和推理上表现优于GPT4。(腾讯新闻)
文章评价
匿名用户
发布
发布