常见问题 | 文档 - PyCaret 机器学习库

为什么选择 PyCaret？

简单来说，它是一个开源的、低代码的机器学习库，构建在你最喜欢的库和框架之上，例如 scikit-learn, xgboost, lightgbm 等。机器学习实验需要大量的迭代，PyCaret 的主要目标是让你能够以闪电般的速度进行迭代。与其他优秀的开源机器学习库相比，PyCaret 是一个替代性的低代码库，只需几行代码就可以取代数百行代码。试试看吧！

PyCaret 兼容所有操作系统和 Python 版本吗？

PyCaret 在 64 位系统上经过测试并受支持

Python 3.7、3.8、3.9 和 3.10
Ubuntu 16.04 或更高版本
Windows 7 或更高版本

PyCaret 也可以在 Mac OS 上运行，但我们不保证性能，因为版本未针对 Mac 进行测试。要了解更多关于我们的测试流程，.

我可以在 Google Colab 或 Kaggle Notebooks 上使用 PyCaret 吗？

当然可以。只需执行 pip install pycaret

PyCaret 支持在 GPU 上训练模型吗？

是的。我们将 PyCaret 与出色的项目集成。要使用 GPU 而不是 CPU，只需在 setup 函数中传入 use_gpu=True。

这将使用 CPU 进行模型训练

from pycaret.classification import *
s = setup(data, target = 'target_name')

这将使用 GPU 进行模型训练

from pycaret.classification import *
s = setup(data, target = 'target_name', use_gpu = True)

API 的用法没有变化，但在某些情况下，需要安装额外的库，因为默认版本或完整版本的 PyCaret 不包含这些库。你可以了解更多关于此的.

我可以将 PyCaret 与 Spark 等并行处理框架一起使用吗？

当然可以。PyCaret 3.0 已与集成。你现在可以在你选择的框架上使用 parallel 参数来分发 compare_models 函数。当前支持的框架有 Ray、Dask 和 Spark。要了解更多信息，请查看.

我如何为 PyCaret 贡献代码？

感谢你选择为 PyCaret 贡献力量。开源社区中有许多优秀的开源项目，我们感谢你对 PyCaret 贡献的兴趣。请查看我们的.

PyCaret 支持深度学习或强化学习吗？

暂时不支持。未来可能会支持。

我可以将 PyCaret 与 Power BI、Tableau、Qlik 等 BI 工具集成吗？

是的，任何支持 Python 环境的工具都可以。你可以在 Power BI、Tableau、SQL、Alteryx、KNIME 中使用 PyCaret。

如何在 PyCaret 中更改详细程度？

PyCaret 中的大多数函数都有 verbose 参数。只需在函数中设置 verbose=False 即可。

示例

lr = create_model('lr', verbose = False)

如何静默日志记录器？

我们注意到在某些情况下，PyCaret 的日志记录器可能与环境中的其他库冲突，导致异常行为，即代码运行时日志会打印在屏幕上（Notebook 或 CLI）。虽然在下一个主要版本 (3.0) 中，我们计划使日志记录器更具可配置性，允许你在需要时完全禁用它。在此期间，有一种方法可以使用环境变量来解决。在你的 Notebook 顶部运行以下代码

import os
os.environ["PYCARET_CUSTOM_LOGGING_LEVEL"] = "CRITICAL"

注意： 此命令将设置 PyCaret 日志记录器使用的环境变量。将其设置为 CRITICAL 意味着只记录关键信息，而 PyCaret 中没有很多关键信息。

安装 PyCaret 时遇到问题，我该怎么办？

我可以在 PyCaret 中添加自己的自定义模型吗？

当然可以。PyCaret 的愿景是让你完全控制你的 ML 流水线。要添加自定义模型，只有一个规则：它们必须与标准 sklearn API 兼容。要了解如何实现，你可以阅读 Fahad Akbar 的以下教程

我可以在 PyCaret 中为交叉验证添加自定义指标吗？

我可以只使用 PyCaret 进行数据预处理吗？

如果你愿意，可以。你可以运行处理所有数据预处理的 setup 函数，之后可以使用 get_config 函数访问转换后的训练集和测试集。

示例

from pycaret.classification import *
s = setup(data, target = 'target_name')

X_train, y_train = get_config('X_train_transformed'), get_config('y_train_transformed')
X_test, y_test = get_config('X_test_transformed'), get_config('y_test_transformed')

我可以将模型从 PyCaret 中导出并在 PyCaret 外部使用吗？

我可以使用 PyCaret 在云端部署 ML 流水线吗？

我可以在 Apple M1 MacBook 上安装和运行 PyCaret 吗？

使用 PyCaret 需要一台强大的电脑吗？

不需要，只要你的数据能放入内存，你就可以使用 PyCaret。不需要超级计算机。

为什么我的拉取请求没有受到关注？

审查过程可能需要一些时间。你的拉取请求审查延迟不应让你灰心。社区提出了许多功能需求，而我们的维护者用于审查和批准这些拉取请求的时间有限。由于每个功能都会产生长期的维护成本，我们非常重视第一次就把事情做好。

PyCaret 可以与 scikit-learn 以及其他 ML 库和框架相媲美吗？

嗯，PyCaret 构建在常见的 ML 库和框架之上，例如 scikit-learn、LightGBM、XGBoost 等。使用 PyCaret 的好处是你无需编写大量代码。底层模型和评估框架与你习惯的相同。