文档
  • PyCaret 3.0
  • 入门
    • 💻安装
    • 🚀快速入门
    • ⭐教程
    • 📶模块
    • ⚙️数据预处理
      • 数据准备
      • 缩放和转换
      • 特征工程
      • 特征选择
      • 其他设置参数
    • 💡函数
      • 初始化
      • 训练
      • 优化
      • 分析
      • 部署
      • 其他
  • 学习 PYCARET
    • 📖博客
      • 宣布 PyCaret 1.0
      • 宣布 PyCaret 2.0
      • 关于 PyCaret 你不知道的 5 件事
      • 构建和部署你的第一个机器学习 Web 应用
      • 使用 PyCaret 在 Power BI 中构建你自己的 AutoML
      • 在 Google Kubernetes 上部署机器学习管道
      • 在 AWS Fargate 上部署 PyCaret 和 Streamlit
      • 使用 PyCaret 在 Power BI 中进行异常检测
      • 在 Google Kubernetes 上部署机器学习应用
      • 在 GKE 上部署机器学习管道
      • 在 AWS Fargate 上部署机器学习管道
      • 使用 Docker 在云端部署机器学习管道
      • 使用 PyCaret 在 Power BI 中进行聚类分析
      • 使用 ONNX Runtime 在边缘设备上部署 PyCaret 模型
      • GitHub 是你唯一需要的最佳 AutoML
      • 在 AWS Fargate 上部署 PyCaret 和 Streamlit
      • 使用 PyCaret 和 MLflow 轻松进行 MLOps
      • 使用 PyCaret 在 Power BI 中进行聚类分析
      • 使用 PyCaret 在 Alteryx 中进行机器学习
      • 使用 PyCaret 在 KNIME 中进行机器学习
      • 使用 PyCaret 在 SQL 中进行机器学习(第一部分)
      • 使用 PyCaret 在 Power BI 中进行机器学习
      • 使用 PyCaret 在 Tableau 中进行机器学习
      • 使用 PyCaret 进行多个时间序列预测
      • 使用 PyCaret 预测客户流失
      • 使用 PyCaret 预测潜在客户评分(正确方法)
      • 使用 PyCaret 在 Python 中进行 NLP 文本分类
      • 使用 PyCaret 预测潜在客户评分(正确方法)
      • 使用 PyCaret 预测黄金价格暴跌
      • 使用机器学习预测黄金价格
      • PyCaret 2.1 功能总结
      • 使用 PyCaret 将机器学习模型部署到 SQL Server
      • 使用 PyCaret 和 Gradio 为你的机器学习赋能
      • 时间序列 101 - 适合初学者
      • 使用 PyCaret 进行时间序列异常检测
      • 使用 PyCaret 回归模型进行时间序列预测
      • 使用 PyCaret 在 Power BI 中进行主题建模
      • 使用 PyCaret 编写和训练自定义机器学习模型
      • 使用 PyCaret 和 Streamlit 构建和部署机器学习应用
      • PyCaret 2.3.6 发布!了解新特性?
    • 📺视频
    • 🛩️速查表
    • ❓常见问题
    • 👩‍💻示例
  • 重要链接
    • 🛠️版本说明
    • ⚙️API 参考
    • 🙋 讨论
    • 📤问题
    • 👮 许可
  • 媒体
    • 💻Slack
    • 📺YouTube
    • 🔗LinkedIn
    • 😾GitHub
    • 🔅Stack Overflow
由 GitBook 提供支持
本页目录
  • pull
  • models
  • get_config
  • set_config
  • get_metrics
  • add_metric
  • remove_metric
  • automl
  • get_logs
  • get_current_experiment
  • set_current_experiment

这有帮助吗?

  1. 入门
  2. 函数

其他

PyCaret 中的其他函数

上一篇部署下一篇博客

最后更新于 2 年前

这有帮助吗?

pull

返回最后打印的评分网格。在任何训练函数之后使用 pull 函数可以将评分网格存储在 pandas.DataFrame 中。

示例

# loading dataset
from pycaret.datasets import get_data
data = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data, target = 'Class variable')

# compare models
best_model = compare_models()

# get the scoring grid
results = pull()
type(results)
# >>> pandas.core.frame.DataFrame

models

返回一个表格,其中包含模型库中导入模块中的所有可用模型。

示例

# loading dataset
from pycaret.datasets import get_data
data = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data, target = 'Class variable')

# check model library
models()

如果你想查看更多信息,可以传递 internal=True 参数。

# loading dataset
from pycaret.datasets import get_data
data = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data, target = 'Class variable')

# check model library
models(internal = True)

get_config

示例

# load dataset
from pycaret.datasets import get_data
data = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data, target = 'Class variable')

# get X_train
get_config('X_train')

使用 get_config 检查所有可访问参数

# check all available param
get_config()

get_config 函数可访问的变量

  • 'USI'

  • 'X'

  • 'X_test'

  • 'X_test_transformed'

  • 'X_train'

  • 'X_train_transformed'

  • 'X_transformed'

  • 'data'

  • 'dataset'

  • 'dataset_transformed'

  • 'exp_id'

  • 'exp_name_log'

  • 'fix_imbalance'

  • 'fold_generator'

  • 'fold_groups_param'

  • 'fold_shuffle_param'

  • 'gpu_n_jobs_param'

  • 'gpu_param'

  • 'html_param'

  • 'idx'

  • 'is_multiclass'

  • 'log_plots_param'

  • 'logging_param'

  • 'memory'

  • 'n_jobs_param'

  • 'pipeline'

  • 'seed'

  • 'target_param'

  • 'test'

  • 'test_transformed'

  • 'train'

  • 'train_transformed'

  • 'variable_and_property_keys'

  • 'variables'

  • 'y'

  • 'y_test'

  • 'y_test_transformed'

  • 'y_train'

  • 'y_train_transformed'

  • 'y_transformed'

set_config

此函数重置全局变量。

示例

# load dataset
from pycaret.datasets import get_data
data = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data, target = 'Class variable', session_id = 123)

# reset environment seed
set_config('seed', 999) 

get_metrics

返回指标容器中所有可用指标的表格。所有这些指标都用于交叉验证。

# load dataset
from pycaret.datasets import get_data
data = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data, target = 'Class variable', session_id = 123)

# get metrics
get_metrics()

add_metric

将自定义指标添加到指标容器。

# load dataset
from pycaret.datasets import get_data
data = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data, target = 'Class variable', session_id = 123)

# add metric
from sklearn.metrics import log_loss
add_metric('logloss', 'Log Loss', log_loss, greater_is_better = False)

现在,如果你检查指标容器

get_metrics()

remove_metric

从指标容器中移除一个指标。

# remove metric
remove_metric('logloss')

无输出。我们再次检查指标容器。

get_metrics()

automl

此函数根据 optimize 参数,从当前设置中所有已训练的模型中返回最佳模型。可以使用 get_metrics 函数访问评估的指标。

示例

# load dataset 
from pycaret.datasets import get_data 
data = get_data('diabetes') 

# init setup 
from pycaret.classification import *
clf1 = setup(data, target = 'Class variable') 

# compare models
top5 = compare_models(n_select = 5) 

# tune models
tuned_top5 = [tune_model(i) for i in top5]

# ensemble models
bagged_top5 = [ensemble_model(i) for i in tuned_top5]

# blend models
blender = blend_models(estimator_list = top5) 

# stack models
stacker = stack_models(estimator_list = top5) 

# automl 
best = automl(optimize = 'Recall')
print(best)

get_logs

示例

# load dataset
from pycaret.datasets import get_data
data = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data, target = 'Class variable', log_experiment = True, experiment_name = 'diabetes1')

# compare models
top5 = compare_models()

# check ML logs
get_logs()

get_current_experiment

获取当前实验对象并返回一个类。当你使用函数式 API 并想切换到面向对象 API 时,这很有用。

# loading dataset
from pycaret.datasets import get_data
data = get_data('insurance')

# init setup using functional API
from pycaret.regression import *
s = setup(data, target = 'charges', session_id = 123)

# compare models
best = compare_models()

# return OOP class for current functional experiment
reg1 = get_current_experiment()

set_current_experiment

将使用面向对象 API 创建的当前实验设置为与函数式 API 一起使用。

# loading dataset
from pycaret.datasets import get_data
data = get_data('insurance')

# init setup using OOP API
from pycaret.regression import RegressionExperiment
reg1 = RegressionExperiment()
reg1.setup(data, target = 'charges', session_id = 123)

# compare models
best = compare_models()

# set OOP experiment as functional
set_current_experiment(reg1)

此函数检索初始化 setup 函数时创建的全局变量。函数。

返回实验日志表格。仅在初始化 setup 函数时设置 log_experiment = True 时有效函数。

💡
输出自 pull()
输出自 models()
输出自 models(internal = True)
输出自 get_config('X_train')
输出自 get_metrics()
输出自 add_metric('logloss', 'Log Loss', log_loss, greater_is_better = False)
输出自 get_metrics() (添加 log loss 指标后)
输出自 get_metrics() (移除 log loss 指标后)
输出自 print(best)
输出自 get_logs()
setup
setup