使用 ONNX Runtime 在边缘设备上部署 PyCaret 模型

文档

使用 ONNX Runtime 在边缘设备上部署 PyCaret 模型

一步步教你如何将使用 PyCaret 训练的 ML 模型转换为 ONNX，以实现高性能推理（CPU 或 GPU）

引言

👉 什么是 PyCaret 以及如何入门？

👉 模型格式有哪些类型（pickle, onnx, pmml 等）？

👉 什么是 ONNX（读作 ONEX）以及它的优势是什么？

👉 使用 PyCaret 训练机器学习模型并将其转换为 ONNX，以便在边缘设备上部署。

PyCaret

特点

skl2onnx

安装

你需要为本教程安装以下库。安装只需几分钟。

**# install pycaret
**pip install pycaret

**# install skl2onnx
**pip install skl2onnx

**# install onnxruntime
**pip install onnxruntime

不同的模型格式

在我介绍 ONNX 和其优势之前，让我们先看看目前有哪些可用于部署的模型格式。

👉Pickle

👉PMML

预测模型标记语言（PMML）是另一种机器学习模型格式，相对而言不如 Pickle 常见。PMML 自 1997 年问世以来，已有大量应用利用该格式。SAP **和 PEGA CRM 等应用能够利用特定版本的 PMML。有一些开源库可以将 scikit-learn 模型（PyCaret）转换为 PMML。PMML 格式最大的缺点是它不支持所有的机器学习模型。

👉ONNX

什么是 ONNX？

ONNX 得到广泛支持，可在许多框架、工具和硬件中找到。实现不同框架之间的互操作性，并简化从研究到生产的路径，有助于提高 AI 社区的创新速度。ONNX 有助于解决与 AI 模型相关的硬件依赖性挑战，并能够将相同的 AI 模型部署到多个硬件加速目标上。

来源：Microsoft

有许多优秀的机器学习库，涵盖各种语言——PyTorch、TensorFlow、scikit-learn、PyCaret 等。其理念是你可以使用任何工具、语言或框架训练模型，然后使用另一种语言或应用进行推理和预测。例如，假设你有一个使用 .Net 构建的 Web 应用、一个 Android 应用，甚至是边缘设备，并且你想将机器学习模型的预测集成到这些下游系统中。你可以通过将模型转换为 ONNX 格式来实现。使用 Pickle 或 PMML 格式无法做到这一点。

主要优势

👉 互操作性

使用你偏好的框架进行开发，无需担心下游推理的影响。ONNX 使你能够将偏好的框架与选择的推理引擎配合使用。

👉 硬件访问

ONNX 使访问硬件优化变得更容易。使用与 ONNX 兼容的运行时和库，这些库旨在最大限度地提高跨硬件的性能。这意味着如果你关心延迟，甚至可以在 GPU 上使用 ONNX 模型进行推理。

👉开始吧

数据集

**# loading dataset
**from pycaret.datasets import get_data
data = get_data('insurance')

**# initialize setup / data preparation
**from pycaret.regression import *
s = setup(data, target = 'charges')

👉 模型训练与选择

现在数据已准备好用于建模，让我们使用 compare_models 函数开始训练过程。它将训练模型库中所有可用的算法，并使用 k 折交叉验证评估多个性能指标。

**# compare all models**
best = compare_models()

基于交叉验证指标，最佳模型是 Gradient Boosting Regressor。你可以使用 save_model 函数将模型保存为 Pickle 文件。

**# save model to drive
**save_model(best, 'c:/users/models/insurance')

这将把模型保存为 Pickle 格式。

👉 使用 Pickle 格式生成预测

你可以使用 load_model 函数将保存的模型加载回 Python 环境，并使用 predict_model 函数生成推理。

**# load the model
**from pycaret.regression import load_model
loaded_model = load_model('c:/users/models/insurance')

**# generate predictions / inference
**from pycaret.regression import predict_model
pred = predict_model(loaded_model, data=data) # new data

👉 ONNX 转换

到目前为止，我们看到的是以 Pickle 格式保存和加载训练好的模型（这是 PyCaret 的默认格式）。然而，使用 skl2onnx 库，我们可以将模型转换为 ONNX

**# convert best model to onnx**
from skl2onnx import to_onnx
X_sample = get_config('X_train')[:1]
model_onnx = to_onnx(best, X_sample.to_numpy())

我们还可以将 model_onnx 保存到本地驱动器

**# save the model to drive**
with open("c:/users/models/insurance.onnx", "wb") as f:
    f.write(model_onnx.SerializeToString())

现在，为了从 insurance.onnx 生成推理，我们将使用 Python 中的 onnxruntime 库（仅为演示）。本质上，你现在可以在任何其他平台或环境中使用这个 insurance.onnx 文件。

**# generate inference on onnx**
from onnxruntime import InferenceSession
sess = InferenceSession(model_onnx.SerializeToString())
X_test = get_config('X_test').to_numpy()
predictions_onnx = sess.run(None, {'X': X_test})[0]

**# print predictions_onnx
**print(predictions_onnx)

请注意，predictions_onnx 的输出是一个 numpy 数组，而我们使用 PyCaret 的 predict_model 函数时得到的是 pandas DataFrame，但如果你比对数值，所有数字都是相同的（使用 ONNX 时，有时会发现在小数点后第 4 位之后有微小差异 — 这种情况非常罕见）。