导航菜单

切换主题

ONNX/TensorRT

ONNX是开放的模型格式标准，TensorRT是NVIDIA的高性能推理引擎，两者配合实现跨平台的高效模型部署。ONNX格式：模型导出与转换；ONNX Runtime：跨平台推理；TensorRT优化：层融合、精度校准；性能对比：速度与兼容性；部署流程：训练到推理pipeline。

资源类型

全部 📄 文章 🎬 视频 💻 代码 📚 官方文档 🤖 大模型官方

难度

全部入门进阶高级专家

学习资源(11 个)

ONNX Runtime Documentation

ONNX Runtime文档

百度千帆 - INT4量化部署

百度千帆INT4部署

腾讯云TI - ONNX推理优化

腾讯云ONNX优化

CSDN - TensorRT优化技巧

TensorRT教程

SegmentFault - ONNX模型转换

模型转换指南

掘金 - TensorRT部署实战

TensorRT实战

飞桨Paddle - ONNX导出

飞桨ONNX导出

ONNX Official Website

ONNX官方网站

NVIDIA TensorRT Documentation

TensorRT文档

PyTorch ONNX Export

PyTorch ONNX导出

ONNX Runtime Performance

ONNX Runtime性能