文档
  • PyCaret 3.0
  • 入门
    • 💻安装
    • 🚀快速开始
    • ⭐教程
    • 📶模块
    • ⚙️数据预处理
      • 数据准备
      • 缩放与变换
      • 特征工程
      • 特征选择
      • 其他设置参数
    • 💡函数
      • 初始化
      • 训练
      • 优化
      • 分析
      • 部署
      • 其他
  • 学习 PYCARET
    • 📖博客
      • 宣布 PyCaret 1.0
      • 宣布 PyCaret 2.0
      • 关于 PyCaret 你可能不知道的 5 件事
      • 构建和部署你的第一个机器学习 Web 应用
      • 使用 PyCaret 在 Power BI 中构建你自己的 AutoML
      • 在 Google Kubernetes 上部署 ML Pipeline
      • 在 AWS Fargate 上部署 PyCaret 和 Streamlit
      • 使用 PyCaret 在 Power BI 中进行异常检测
      • 在 Google Kubernetes 上部署 ML 应用
      • 在 GKE 上部署机器学习 Pipeline
      • 在 AWS Fargate 上部署机器学习 Pipeline
      • 使用 Docker 在云上部署 ML Pipeline
      • 使用 PyCaret 在 Power BI 中进行聚类分析
      • 使用 ONNX Runtime 在边缘设备上部署 PyCaret 模型
      • GitHub 是你唯一需要的最佳 AutoML
      • 在 AWS Fargate 上部署 PyCaret 和 Streamlit
      • 使用 PyCaret 和 MLflow 轻松实现 MLOps
      • 使用 PyCaret 在 Power BI 中进行聚类分析
      • 使用 PyCaret 在 Alteryx 中进行机器学习
      • 使用 PyCaret 在 KNIME 中进行机器学习
      • 使用 PyCaret 在 SQL 中进行机器学习 第一部分
      • 使用 PyCaret 在 Power BI 中进行机器学习
      • 使用 PyCaret 在 Tableau 中进行机器学习
      • 使用 PyCaret 进行多时间序列预测
      • 使用 PyCaret 预测客户流失
      • 使用 PyCaret (正确的方式) 预测潜在客户得分
      • 使用 PyCaret 在 Python 中进行 NLP 文本分类
      • 使用 PyCaret (正确的方式) 预测潜在客户得分
      • 使用 PyCaret 预测黄金价格暴跌
      • 使用机器学习预测黄金价格
      • PyCaret 2.1 功能摘要
      • 使用 PyCaret 将 ML 模型部署到 SQL Server
      • 使用 PyCaret 和 Gradio 为您的机器学习注入超能力
      • 时间序列 101 - 入门篇
      • 使用 PyCaret 进行时间序列异常检测
      • 使用 PyCaret 回归模型进行时间序列预测
      • 使用 PyCaret 在 Power BI 中进行主题建模
      • 使用 PyCaret 编写和训练自定义 ML 模型
      • 使用 PyCaret 和 Streamlit 构建和部署 ML 应用
      • PyCaret 2.3.6 已发布!了解新特性
    • 📺视频
    • 🛩️备忘单
    • ❓常见问题
    • 👩‍💻示例
  • 重要链接
    • 🛠️发布说明
    • ⚙️API 参考
    • 🙋 讨论
    • 📤问题
    • 👮 许可
  • 媒体
    • 💻Slack
    • 📺YouTube
    • 🔗LinkedIn
    • 😾GitHub
    • 🔅Stack Overflow
由 GitBook 提供支持
本页内容
  • 使用 PyCaret 和 Gradio 为您的机器学习实验注入超能力
  • 👉 简介
  • 👉 PyCaret
  • 👉 Gradio
  • 👉 安装 PyCaret
  • 👉 安装 Gradio
  • 👉 开始吧
  • 👉 初始化设置
  • 👉 比较模型
  • 👉 Gradio
  • 第一部分 — 创建一个内部函数
  • 第二部分 — 使用 Gradio 创建用户界面
  • 即将推出!
  • 您可能还感兴趣
  • 重要链接
  • 想了解特定模块?

这有帮助吗?

  1. 学习 PYCARET
  2. 博客

使用 PyCaret 和 Gradio 为您的机器学习注入超能力

上一篇使用 PyCaret 将 ML 模型部署到 SQL Server下一篇时间序列 101 - 入门篇

最后更新于 2 年前

这有帮助吗?

使用 PyCaret 和 Gradio 为您的机器学习实验注入超能力

一步一步教你快速开发和与机器学习 Pipeline 交互

图片来源:Hunter Harritt on Unsplash

👉 简介

👉 PyCaret

PyCaret 是一个开源、低代码的机器学习库和端到端模型管理工具,用 Python 构建,用于自动化机器学习工作流程。它因其易用性、简单性以及快速高效地构建和部署端到端 ML 原型的能力而广受欢迎。

PyCaret 是一个替代性的低代码库,只需几行代码就可以替代数百行代码。这使得实验周期呈指数级加快和高效。

PyCaret 简单且 易于使用。在 PyCaret 中执行的所有操作都按顺序存储在 Pipeline 中,完全自动化以用于**部署**。无论是填充缺失值、独热编码、转换分类数据、特征工程,甚至是超参数调优,PyCaret 都能自动完成。

👉 Gradio

Gradio 是一个开源的 Python 库,用于围绕你的机器学习模型创建可定制的用户界面组件。Gradio 让你可以在浏览器中轻松地通过拖放图片、粘贴文本、录制语音等方式“玩转”你的模型,并查看模型的输出。

Gradio 有助于:

  • 为你训练好的 ML Pipeline 创建快速演示

  • 获取模型性能的实时反馈

  • 在开发过程中交互式地调试你的模型

👉 安装 PyCaret

安装 PyCaret 非常简单,只需几分钟。我们强烈建议使用虚拟环境,以避免与其他库发生潜在冲突。

**# install slim version (default)
**pip install pycaret

**# install the full version**
pip install pycaret[full]

👉 安装 Gradio

你可以通过 pip 安装 gradio。

pip install gradio

👉 开始吧

**# load the iris dataset from pycaret repo**
from pycaret.datasets import get_data
data = get_data('iris')

👉 初始化设置

**# initialize setup**
from pycaret.classification import *
s = setup(data, target = 'species', session_id = 123)

每当你在 PyCaret 中初始化 setup 函数时,它会分析数据集并推断所有输入特征的数据类型。在这种情况下,你可以看到所有四个特征(sepal_length, sepal_width, petal_length, and petal_width)都被正确识别为 Numeric 数据类型。你可以按 Enter 键继续。

👉 比较模型

这是我们在 PyCaret 中进行任何有监督实验工作流程中推荐的第一步。此函数使用默认超参数训练模型库中所有可用的模型,并使用交叉验证评估性能指标。

此函数的输出是一个表格,显示所有模型的平均交叉验证得分。折叠数可以使用 fold 参数定义(默认值 = 10 折叠)。表格按选择的指标排序(从高到低),该指标可以使用 sort 参数定义(默认值 = ‘Accuracy’)。

best = compare_models(n_select = 15)
compare_model_results = pull()

setup 函数中的 n_select 参数控制训练模型的返回数量。在这种情况下,我将其设置为 15,表示返回前 15 个模型作为列表。第二行中的 pull 函数将 compare_models 的输出存储为 pd.DataFrame 。

len(best)
>>> 15

print(best[:5])

👉 Gradio

现在建模过程已经完成,让我们使用 Gradio 创建一个简单的用户界面来与我们的模型进行交互。我将分两部分进行:首先,我将创建一个函数,该函数将使用 PyCaret 的 predict_model 功能生成并返回预测结果;其次,我将把该函数输入到 Gradio 中,并设计一个简单的输入表单以实现交互性。

第一部分 — 创建一个内部函数

代码的前两行获取输入特征并将它们转换为 pandas DataFrame。第 7 行创建 compare_models 输出中显示的唯一模型名称列表(这将在 UI 中用作下拉菜单)。第 8 行根据列表的索引值(通过 UI 传入)选择最佳模型,第 9 行使用 PyCaret 的 predict_model 功能对数据集进行评分。

第二部分 — 使用 Gradio 创建用户界面

下面代码的第 3 行创建一个模型名称下拉菜单,第 4-7 行分别为每个输入特征创建一个滑块,我已将默认值设置为每个特征的平均值。第 9 行初始化用户界面(在 Notebook 中以及在你的本地主机上,因此你可以在浏览器中查看它)。

你可以在此处观看这段快速视频,了解如何轻松地与你的 Pipeline 交互并查询你的模型,而无需编写数百行代码或开发完整的 Web 前端。

我希望你会喜欢 PyCaret 和 Gradio 的易用性和简洁性。只需不到 25 行代码和几分钟的实验,我就使用 PyCaret 训练和评估了多个模型,并开发了一个轻量级用户界面,以便在 Notebook 中与模型交互。

即将推出!

使用这个轻量级的 Python 工作流程自动化库,你可以实现的功能没有限制。如果你觉得这很有用,请不要忘记在我们的 GitHub 仓库中给我们 ⭐️。

您可能还感兴趣

重要链接

想了解特定模块?

点击下方链接查看文档和可运行示例。

本教程逐步解释了如何集成和,这两个强大的 Python 开源库,并在几分钟内为你的机器学习实验注入超能力。

本教程是一个“hello world”示例,我使用了来自 UCI 的数据集,这是一个多分类问题,目标是预测鸢尾花的类别。此示例中提供的代码可以在任何其他数据集上复现,无需进行重大修改。

要了解更多关于 PyCaret 的信息,请查看其.

要了解更多关于 Gradio 的信息,请查看其.

PyCaret 和 Gradio 的工作流程

PyCaret 的默认安装是 pycaret 的精简版本,只安装硬性依赖项,这些依赖项.

当你安装完整版本的 pycaret 时,所有可选依赖项也都已安装。

鸢尾花数据集的样本行
setup 函数的输出 — 为显示而截断

与 PyCaret 中所有模块一样,setup 函数是在 PyCaret 中开始任何机器学习实验的第一个也是唯一必需的步骤。除了默认执行一些基本处理任务外,PyCaret 还提供了广泛的预处理功能,例如, , ,以及几个关键的数据准备步骤,例如, , 等。要了解 PyCaret 中的所有预处理功能,你可以查看此.

https://pycaret.cn/preprocessing/
compare_models 函数的输出
print(best[:5]) 的输出
运行 Gradio 界面的输出

下周我将撰写一篇关于使用的时间序列数据无监督异常检测教程。请在, ,和上关注我,获取更多更新。

要了解更多关于 PyCaret 的信息,请在和.

加入我们的 Slack 频道。邀请链接.

📖
PyCaret
Gradio
鸢尾花数据集
GitHub
GitHub
此处列出
此处列出
缩放和变换
特征工程
特征选择
独热编码
缺失值填充
过采样/欠采样
链接
PyCaret 异常检测模块
Medium
LinkedIn
Twitter
LinkedIn
Youtube
这里
使用 PyCaret 2.0 在 Power BI 中构建你自己的 AutoML
使用 Docker 在 Azure 上部署机器学习 Pipeline
在 Google Kubernetes Engine 上部署机器学习 Pipeline
在 AWS Fargate 上部署机器学习 Pipeline
构建和部署你的第一个机器学习 Web 应用
使用 AWS Fargate 无服务器部署 PyCaret 和 Streamlit 应用
使用 PyCaret 和 Streamlit 构建和部署机器学习 Web 应用
在 GKE 上部署使用 Streamlit 和 PyCaret 构建的机器学习应用
文档
博客
GitHub
StackOverflow
安装 PyCaret
Notebook 教程
贡献 PyCaret
分类
回归
聚类
异常检测
自然语言处理
关联规则挖掘