文档
  • PyCaret 3.0
  • 开始
    • 💻安装
    • 🚀快速入门
    • ⭐教程
    • 📶模块
    • ⚙️数据预处理
      • 数据准备
      • 缩放与转换
      • 特征工程
      • 特征选择
      • 其他 setup 参数
    • 💡函数
      • 初始化
      • 训练
      • 优化
      • 分析
      • 部署
      • 其他
  • 学习 PYCARET
    • 📖博客
      • PyCaret 1.0 发布
      • PyCaret 2.0 发布
      • 关于 PyCaret 你可能不知道的 5 件事
      • 构建和部署你的第一个机器学习 Web 应用
      • 使用 PyCaret 在 Power BI 中构建你自己的 AutoML
      • 在 Google Kubernetes 上部署 ML 流水线
      • 在 AWS Fargate 上部署 PyCaret 和 Streamlit
      • 使用 PyCaret 在 Power BI 中实现异常检测
      • 在 Google Kubernetes 上部署 ML 应用
      • 在 GKE 上部署机器学习流水线
      • 在 AWS Fargate 上部署机器学习流水线
      • 使用 Docker 在云端部署 ML 流水线
      • 使用 PyCaret 在 Power BI 中进行聚类分析
      • 使用 ONNX Runtime 在边缘部署 PyCaret 模型
      • GitHub 是你唯一需要的 AutoML
      • 在 AWS Fargate 上部署 PyCaret 和 Streamlit
      • 使用 PyCaret 和 MLflow 轻松实现 MLOps
      • 使用 PyCaret 在 Power BI 中进行聚类分析
      • 使用 PyCaret 在 Alteryx 中实现机器学习
      • 使用 PyCaret 在 KNIME 中实现机器学习
      • 使用 PyCaret 在 SQL 中实现机器学习 第一部分
      • 使用 PyCaret 在 Power BI 中实现机器学习
      • 使用 PyCaret 在 Tableau 中实现机器学习
      • 使用 PyCaret 进行多重时间序列预测
      • 使用 PyCaret 预测客户流失
      • 使用 PyCaret 预测潜在客户得分(正确方法)
      • 使用 PyCaret 在 Python 中进行 NLP 文本分类
      • 使用 PyCaret 预测潜在客户得分(正确方法)
      • 使用 PyCaret 预测黄金价格暴跌
      • 使用机器学习预测黄金价格
      • PyCaret 2.1 功能摘要
      • 使用 PyCaret 将 ML 模型导入 SQL Server
      • 使用 PyCaret 和 Gradio 为你的 ML 加速
      • 时间序列 101 - 适合初学者
      • 使用 PyCaret 进行时间序列异常检测
      • 使用 PyCaret 回归进行时间序列预测
      • 使用 PyCaret 在 Power BI 中进行主题建模
      • 使用 PyCaret 编写和训练自定义 ML 模型
      • 使用 PyCaret 和 Streamlit 构建和部署 ML 应用
      • PyCaret 2.3.6 已发布!了解新功能?
    • 📺视频
    • 🛩️备忘单
    • ❓常见问题解答
    • 👩‍💻示例
  • 重要链接
    • 🛠️版本说明
    • ⚙️API 参考
    • 🙋 讨论区
    • 📤问题报告
    • 👮 许可证
  • 社交媒体
    • 💻Slack
    • 📺YouTube
    • 🔗LinkedIn
    • 😾GitHub
    • 🔅Stack Overflow
由 GitBook 提供支持
本页内容

这有帮助吗?

  1. 学习 PYCARET

常见问题解答

常见问题!

上一页备忘单

最后更新时间 2 年前

这有帮助吗?

为什么选择 PyCaret?

简单来说,它是一个开源的、低代码的机器学习库,构建在你最喜欢的库和框架之上,例如 scikit-learn, xgboost, lightgbm 等。机器学习实验需要大量的迭代,PyCaret 的主要目标是让你能够以闪电般的速度进行迭代。与其他优秀的开源机器学习库相比,PyCaret 是一个替代性的低代码库,只需几行代码就可以取代数百行代码。试试看吧!

PyCaret 兼容所有操作系统和 Python 版本吗?

PyCaret 在 64 位系统上经过测试并受支持

  • Python 3.7、3.8、3.9 和 3.10

  • Ubuntu 16.04 或更高版本

  • Windows 7 或更高版本

PyCaret 也可以在 Mac OS 上运行,但我们不保证性能,因为版本未针对 Mac 进行测试。要了解更多关于我们的测试流程,.

我可以在 Google Colab 或 Kaggle Notebooks 上使用 PyCaret 吗?

当然可以。只需执行 pip install pycaret

PyCaret 支持在 GPU 上训练模型吗?

是的。我们将 PyCaret 与出色的项目集成。要使用 GPU 而不是 CPU,只需在 setup 函数中传入 use_gpu=True。

这将使用 CPU 进行模型训练

from pycaret.classification import *
s = setup(data, target = 'target_name')

这将使用 GPU 进行模型训练

from pycaret.classification import *
s = setup(data, target = 'target_name', use_gpu = True)

API 的用法没有变化,但在某些情况下,需要安装额外的库,因为默认版本或完整版本的 PyCaret 不包含这些库。你可以了解更多关于此的.

我可以将 PyCaret 与 Spark 等并行处理框架一起使用吗?

当然可以。PyCaret 3.0 已与集成。你现在可以在你选择的框架上使用 parallel 参数来分发 compare_models 函数。当前支持的框架有 Ray、Dask 和 Spark。要了解更多信息,请查看.

我如何为 PyCaret 贡献代码?

感谢你选择为 PyCaret 贡献力量。开源社区中有许多优秀的开源项目,我们感谢你对 PyCaret 贡献的兴趣。请查看我们的.

PyCaret 支持深度学习或强化学习吗?

暂时不支持。未来可能会支持。

我可以将 PyCaret 与 Power BI、Tableau、Qlik 等 BI 工具集成吗?

是的,任何支持 Python 环境的工具都可以。你可以在 Power BI、Tableau、SQL、Alteryx、KNIME 中使用 PyCaret。

如何在 PyCaret 中更改详细程度?

PyCaret 中的大多数函数都有 verbose 参数。只需在函数中设置 verbose=False 即可。

示例

lr = create_model('lr', verbose = False)
如何静默日志记录器?

我们注意到在某些情况下,PyCaret 的日志记录器可能与环境中的其他库冲突,导致异常行为,即代码运行时日志会打印在屏幕上(Notebook 或 CLI)。虽然在下一个主要版本 (3.0) 中,我们计划使日志记录器更具可配置性,允许你在需要时完全禁用它。在此期间,有一种方法可以使用环境变量来解决。在你的 Notebook 顶部运行以下代码

import os
os.environ["PYCARET_CUSTOM_LOGGING_LEVEL"] = "CRITICAL"

注意: 此命令将设置 PyCaret 日志记录器使用的环境变量。将其设置为 CRITICAL 意味着只记录关键信息,而 PyCaret 中没有很多关键信息。

安装 PyCaret 时遇到问题,我该怎么办?
我可以在 PyCaret 中添加自己的自定义模型吗?

当然可以。PyCaret 的愿景是让你完全控制你的 ML 流水线。要添加自定义模型,只有一个规则:它们必须与标准 sklearn API 兼容。要了解如何实现,你可以阅读 Fahad Akbar 的以下教程

我可以在 PyCaret 中为交叉验证添加自定义指标吗?
我可以只使用 PyCaret 进行数据预处理吗?

如果你愿意,可以。你可以运行处理所有数据预处理的 setup 函数,之后可以使用 get_config 函数访问转换后的训练集和测试集。

示例

from pycaret.classification import *
s = setup(data, target = 'target_name')

X_train, y_train = get_config('X_train_transformed'), get_config('y_train_transformed')
X_test, y_test = get_config('X_test_transformed'), get_config('y_test_transformed')
我可以将模型从 PyCaret 中导出并在 PyCaret 外部使用吗?
我可以使用 PyCaret 在云端部署 ML 流水线吗?
我可以在 Apple M1 MacBook 上安装和运行 PyCaret 吗?
使用 PyCaret 需要一台强大的电脑吗?

不需要,只要你的数据能放入内存,你就可以使用 PyCaret。不需要超级计算机。

为什么我的拉取请求没有受到关注?

审查过程可能需要一些时间。你的拉取请求审查延迟不应让你灰心。社区提出了许多功能需求,而我们的维护者用于审查和批准这些拉取请求的时间有限。由于每个功能都会产生长期的维护成本,我们非常重视第一次就把事情做好。

PyCaret 可以与 scikit-learn 以及其他 ML 库和框架相媲美吗?

嗯,PyCaret 构建在常见的 ML 库和框架之上,例如 scikit-learn、LightGBM、XGBoost 等。使用 PyCaret 的好处是你无需编写大量代码。底层模型和评估框架与你习惯的相同。

在我们的搜索,看看其他人是否遇到过同样的问题。如果你仍然无法解决,请随时提交一份.

当然可以。PyCaret 致力于平衡抽象与灵活性,并且到目前为止我们做得相当不错。你可以使用 PyCaret 的 add_metric 和 remove_metric 函数来添加或删除用于交叉验证的指标。.

当然可以。你可以使用 PyCaret 的 save_model 函数将整个 Pipeline 导出为 pkl 文件。关于此函数。

当然可以。PyCaret 是一个端到端库,具有许多部署功能。官方提供了许多关于在不同云平台(如 Azure、AWS 和 GCP)上进行部署的教程。你可以查看这些.

由于 PyCaret 底层依赖的一些问题,这不太直接。但是,如果你尝试了所有方法仍找不到解决方案,这篇由 Pareekshith Katti 撰写的文章可能会帮助你。

❓
GitHub
新问题报告
使用 PyCaret 的自定义估计器 - 第一部分
使用 PyCaret 的自定义估计器 - 第二部分
文章
点击这里
Rapids.AI
Fugue
贡献指南
这里的教程
了解更多
了解更多
这里
此链接