为什么选择 PyCaret?
简单来说,它是一个开源的、低代码的机器学习库,构建在你最喜欢的库和框架之上,例如 scikit-learn, xgboost, lightgbm 等。机器学习实验需要大量的迭代,PyCaret 的主要目标是让你能够以闪电般的速度进行迭代。与其他优秀的开源机器学习库相比,PyCaret 是一个替代性的低代码库,只需几行代码就可以取代数百行代码。试试看吧!
PyCaret 兼容所有操作系统和 Python 版本吗?
PyCaret 在 64 位系统上经过测试并受支持
Python 3.7、3.8、3.9 和 3.10
PyCaret 也可以在 Mac OS 上运行,但我们不保证性能,因为版本未针对 Mac 进行测试。要了解更多关于我们的测试流程,.
我可以在 Google Colab 或 Kaggle Notebooks 上使用 PyCaret 吗?
当然可以。只需执行 pip install pycaret
PyCaret 支持在 GPU 上训练模型吗?
是的。我们将 PyCaret 与出色的项目集成。要使用 GPU 而不是 CPU,只需在 setup
函数中传入 use_gpu=True
。
这将使用 CPU 进行模型训练
from pycaret.classification import *
s = setup(data, target = 'target_name')
这将使用 GPU 进行模型训练
from pycaret.classification import *
s = setup(data, target = 'target_name', use_gpu = True)
API 的用法没有变化,但在某些情况下,需要安装额外的库,因为默认版本或完整版本的 PyCaret 不包含这些库。你可以了解更多关于此的.
我可以将 PyCaret 与 Spark 等并行处理框架一起使用吗?
当然可以。PyCaret 3.0 已与集成。你现在可以在你选择的框架上使用 parallel
参数来分发 compare_models
函数。当前支持的框架有 Ray
、Dask
和 Spark
。要了解更多信息,请查看.
我如何为 PyCaret 贡献代码?
感谢你选择为 PyCaret 贡献力量。开源社区中有许多优秀的开源项目,我们感谢你对 PyCaret 贡献的兴趣。请查看我们的.
如何在 PyCaret 中更改详细程度?
PyCaret 中的大多数函数都有 verbose
参数。只需在函数中设置 verbose=False
即可。
示例
lr = create_model('lr', verbose = False)
如何静默日志记录器?
我们注意到在某些情况下,PyCaret 的日志记录器可能与环境中的其他库冲突,导致异常行为,即代码运行时日志会打印在屏幕上(Notebook 或 CLI)。虽然在下一个主要版本 (3.0) 中,我们计划使日志记录器更具可配置性,允许你在需要时完全禁用它。在此期间,有一种方法可以使用环境变量来解决。在你的 Notebook 顶部运行以下代码
import os
os.environ["PYCARET_CUSTOM_LOGGING_LEVEL"] = "CRITICAL"
注意: 此命令将设置 PyCaret 日志记录器使用的环境变量。将其设置为 CRITICAL
意味着只记录关键信息,而 PyCaret 中没有很多关键信息。
我可以在 PyCaret 中添加自己的自定义模型吗?
当然可以。PyCaret 的愿景是让你完全控制你的 ML 流水线。要添加自定义模型,只有一个规则:它们必须与标准 sklearn
API 兼容。要了解如何实现,你可以阅读 Fahad Akbar 的以下教程
我可以只使用 PyCaret 进行数据预处理吗?
如果你愿意,可以。你可以运行处理所有数据预处理的 setup
函数,之后可以使用 get_config
函数访问转换后的训练集和测试集。
示例
from pycaret.classification import *
s = setup(data, target = 'target_name')
X_train, y_train = get_config('X_train_transformed'), get_config('y_train_transformed')
X_test, y_test = get_config('X_test_transformed'), get_config('y_test_transformed')
使用 PyCaret 需要一台强大的电脑吗?
不需要,只要你的数据能放入内存,你就可以使用 PyCaret。不需要超级计算机。
为什么我的拉取请求没有受到关注?
审查过程可能需要一些时间。你的拉取请求审查延迟不应让你灰心。社区提出了许多功能需求,而我们的维护者用于审查和批准这些拉取请求的时间有限。由于每个功能都会产生长期的维护成本,我们非常重视第一次就把事情做好。
PyCaret 可以与 scikit-learn 以及其他 ML 库和框架相媲美吗?
嗯,PyCaret 构建在常见的 ML 库和框架之上,例如 scikit-learn、LightGBM、XGBoost 等。使用 PyCaret 的好处是你无需编写大量代码。底层模型和评估框架与你习惯的相同。