理解OpenAI Sora的技术原理,掌握视频理解的核心任务和方法。Sora技术架构:DiT、时空Patch;世界模拟器:物理规律建模;视频理解任务:分类、检测、字幕;视频问答:Video QA、时序推理;视频特征提取:VideoMAE、VideoCLIP。
InfoQ开源模型