导航菜单
切换主题

多模态 Agent

掌握多模态智能体的构建方法,实现能够处理图像、音频、视频的Agent系统。多模态Agent架构:感知、决策、执行;工具调用:图像分析、视频处理、语音识别;多模态规划:任务分解、工具选择;记忆机制:多模态上下文、历史管理;应用场景:视觉助手、视频分析、多模态问答。

学习资源(0 个)

📭

没有符合筛选条件的资源