减少提示词长度同时保持性能,降低API成本。压缩方法:LLMLingua、语义压缩、冗余消除;压缩策略:保留关键信息、压缩示例;效果评估:性能保持、成本降低;应用场景:长提示词、批量处理。
51CTO MCP集成
LLMLingua论文