掌握多模态检索增强生成技术,实现基于图像、文档等多模态内容的RAG系统。多模态RAG架构:图像检索、混合检索;多模态嵌入:CLIP、ImageBind、视觉编码器;检索策略:文本-图像对齐、跨模态检索;多模态重排序:相关性融合、多模态打分;应用场景:图文检索、视频搜索、文档问答。
没有符合筛选条件的资源