Phi-3.5-MoE 是Microsoft的MoE架构模型,在保持高效推理的同时大幅提升性能。
使用方法
1
通过Azure OpenAI调用
2
或从HuggingFace下载
3
发送请求
核心参数
上下文窗口
128,000
最大输出
4,096
输入模态
文本
开源状态
开源
规格信息
架构类型
MoE
参数量
16x3.8B
API 定价
🌱 开源模型
该模型为开源模型,可免费使用或自行部署
功能特性
MoE架构
高效推理
性能提升
适用场景
开发者
研究人员
推荐算力平台
💾
16x3.8B 模型部署需求
入门级消费显卡即可运行
最小显存:3GB(INT4)
推荐显存:5GB(INT8)
完整精度:9GB(FP16)
常见问题
Phi-3.5-MoE是什么?▼
Phi-3.5-MoE 是Microsoft的MoE架构模型,在保持高效推理的同时大幅提升性能。
Phi-3.5-MoE的核心参数是什么?▼
Phi-3.5-MoE是Microsoft推出的模型,上下文窗口128,000tokens,最大输出4,096tokens,开源模型。
Phi-3.5-MoE的API价格是多少?▼
Phi-3.5-MoE是开源模型,可以免费下载使用。如需API服务,可使用各大推理平台提供的托管服务。
Phi-3.5-MoE有哪些主要功能?▼
MoE架构、高效推理、性能提升




