宣布 PyCaret 2.0
最后更新于
这有帮助吗?
最后更新于
这有帮助吗?
我们很高兴今天宣布 PyCaret 的第二个版本。
PyCaret 是一个开源的 Python 低代码机器学习库,可自动化机器学习工作流程。它是一个端到端的机器学习和模型管理工具,可以加速机器学习实验周期并提高您的工作效率。
与其他开源机器学习库相比,PyCaret 是一个替代性的低代码库,只需少量代码即可替代数百行代码。这使得实验呈指数级地快速和高效。
安装 PyCaret 非常简单,只需几分钟。我们强烈建议使用虚拟环境,以避免与其他库潜在的冲突。请参阅以下示例代码来创建 conda ***环境***并在该 conda 环境中安装 pycaret
如果您正在使用 Azure notebooks 或 Google Colab,运行以下代码即可安装 PyCaret。
在 PyCaret 中进行任何机器学习实验的第一步是通过导入相关模块并传递数据帧和目标变量名称来初始化 **setup 函数** 来设置环境。请参阅示例代码
示例输出
这是我们在任何监督式机器学习任务中推荐的第一步。此函数使用默认超参数训练模型库中的所有模型,并使用交叉验证评估性能指标。它返回训练好的模型对象类。使用的评估指标包括
**对于分类:**Accuracy, AUC, Recall, Precision, F1, Kappa, MCC
**对于回归:**MAE, MSE, RMSE, R2, RMSLE, MAPE
以下是使用 compare_models 函数的几种方法
示例输出
Create Model 函数使用默认超参数训练模型,并使用交叉验证评估性能指标。此函数是 PyCaret 中几乎所有其他函数的基础。它返回训练好的模型对象类。以下是使用此函数的几种方法
示例输出
Tune Model 函数调优作为估计器传入的模型的超参数。它使用随机网格搜索和预定义的、完全可定制的调优网格。以下是使用此函数的几种方法
有几个可用于集成基础学习器的函数。 ensemble_model、**blend_models** 和 **stack_models** 是其中的三个。以下是使用此函数的几种方法
顾名思义,此函数用于推断/预测。以下是如何使用它
Plot Model 函数用于评估训练好的机器学习模型的性能。以下是一个示例
或者,您可以使用 **evaluate_model** 函数通过 notebook 中的用户界面查看图表。
PyCaret 2.0 包含几个新的实用函数,在您使用 PyCaret 管理机器学习实验时非常方便。其中一些如下所示
PyCaret 2.0 集成了 MLflow 跟踪组件作为后端 API 和用户界面,用于在运行机器学习代码时记录参数、代码版本、指标和输出文件,并用于后续可视化结果。以下是您如何在 PyCaret 中记录实验。
输出 (在 localhost:5000 上)
使用所有函数,让我们创建一个简单的命令行软件,该软件将使用默认参数训练多个模型,调优最佳候选模型的超参数,尝试不同的集成技术,并返回/保存最佳模型。以下是命令行脚本
此脚本将动态选择并保存最佳模型。只需几行代码,您就开发了自己的 Auto ML 软件,该软件拥有完善的日志记录系统,甚至还有一个展示精美排行榜的用户界面。
使用 Python 中轻量级的工作流程自动化库,您可以实现的功能没有限制。如果您觉得这很有用,如果您喜欢 PyCaret,请不要忘记在我们的 github 仓库上给我们点亮 ⭐️。
点击下方链接查看文档和工作示例。
查看详细的适用于 PyCaret 2.0。
使用 pip 安装 PyCaret 时,所有硬依赖项都会自动安装。查看完整的依赖项列表。
所有预处理转换都在 **setup 函数**中应用。PyCaret 提供了 20 多种不同的预处理转换,可以在 setup 函数中定义。了解更多关于 PyCaret 预处理能力的信息。
要了解更多关于 create model 函数的信息,.
要了解更多关于 tune model 函数的信息,.
要了解更多关于 PyCaret 中的集成模型的信息,.
了解更多关于 PyCaret 中不同可视化的信息。
要查看 PyCaret 2.0 中实现的所有新函数,请参阅.
要了解更多关于 PyCaret 的信息,请关注我们的和.