掌握图像描述生成技术,理解从图像生成自然语言描述的方法。图像描述任务:单句描述、段落描述;模型架构:编码器-解码器、Transformer;评估指标:BLEU、CIDEr、METEOR、SPICE;应用场景:无障碍、电商、社交媒体;最新进展:BLIP、OFM、区域描述。
InfoQ无障碍