其他 | 文档 - PyCaret 机器学习库

pull

返回最后打印的评分网格。在任何训练函数之后使用 pull 函数可以将评分网格存储在 pandas.DataFrame 中。

示例

# loading dataset
from pycaret.datasets import get_data
data = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data, target = 'Class variable')

# compare models
best_model = compare_models()

# get the scoring grid
results = pull()

type(results)
# >>> pandas.core.frame.DataFrame

models

返回一个表格，其中包含模型库中导入模块中的所有可用模型。

示例

# loading dataset
from pycaret.datasets import get_data
data = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data, target = 'Class variable')

# check model library
models()

如果你想查看更多信息，可以传递 internal=True 参数。

# loading dataset
from pycaret.datasets import get_data
data = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data, target = 'Class variable')

# check model library
models(internal = True)

get_config

示例

# load dataset
from pycaret.datasets import get_data
data = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data, target = 'Class variable')

# get X_train
get_config('X_train')

使用 get_config 检查所有可访问参数

# check all available param
get_config()

get_config 函数可访问的变量

'USI'
'X'
'X_test'
'X_test_transformed'
'X_train'
'X_train_transformed'
'X_transformed'
'data'
'dataset'
'dataset_transformed'
'exp_id'
'exp_name_log'
'fix_imbalance'
'fold_generator'
'fold_groups_param'
'fold_shuffle_param'
'gpu_n_jobs_param'
'gpu_param'
'html_param'
'idx'
'is_multiclass'
'log_plots_param'
'logging_param'
'memory'
'n_jobs_param'
'pipeline'
'seed'
'target_param'
'test'
'test_transformed'
'train'
'train_transformed'
'variable_and_property_keys'
'variables'
'y'
'y_test'
'y_test_transformed'
'y_train'
'y_train_transformed'
'y_transformed'

set_config

此函数重置全局变量。

示例

# load dataset
from pycaret.datasets import get_data
data = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data, target = 'Class variable', session_id = 123)

# reset environment seed
set_config('seed', 999)

get_metrics

返回指标容器中所有可用指标的表格。所有这些指标都用于交叉验证。

# load dataset
from pycaret.datasets import get_data
data = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data, target = 'Class variable', session_id = 123)

# get metrics
get_metrics()

add_metric

将自定义指标添加到指标容器。

# load dataset
from pycaret.datasets import get_data
data = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data, target = 'Class variable', session_id = 123)

# add metric
from sklearn.metrics import log_loss
add_metric('logloss', 'Log Loss', log_loss, greater_is_better = False)

现在，如果你检查指标容器

get_metrics()

remove_metric

从指标容器中移除一个指标。

# remove metric
remove_metric('logloss')

无输出。我们再次检查指标容器。

get_metrics()

automl

此函数根据 optimize 参数，从当前设置中所有已训练的模型中返回最佳模型。可以使用 get_metrics 函数访问评估的指标。

示例

# load dataset 
from pycaret.datasets import get_data 
data = get_data('diabetes') 

# init setup 
from pycaret.classification import *
clf1 = setup(data, target = 'Class variable') 

# compare models
top5 = compare_models(n_select = 5) 

# tune models
tuned_top5 = [tune_model(i) for i in top5]

# ensemble models
bagged_top5 = [ensemble_model(i) for i in tuned_top5]

# blend models
blender = blend_models(estimator_list = top5) 

# stack models
stacker = stack_models(estimator_list = top5) 

# automl 
best = automl(optimize = 'Recall')
print(best)

get_logs

示例

# load dataset
from pycaret.datasets import get_data
data = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data, target = 'Class variable', log_experiment = True, experiment_name = 'diabetes1')

# compare models
top5 = compare_models()

# check ML logs
get_logs()

get_current_experiment

获取当前实验对象并返回一个类。当你使用函数式 API 并想切换到面向对象 API 时，这很有用。

# loading dataset
from pycaret.datasets import get_data
data = get_data('insurance')

# init setup using functional API
from pycaret.regression import *
s = setup(data, target = 'charges', session_id = 123)

# compare models
best = compare_models()

# return OOP class for current functional experiment
reg1 = get_current_experiment()

set_current_experiment

将使用面向对象 API 创建的当前实验设置为与函数式 API 一起使用。

# loading dataset
from pycaret.datasets import get_data
data = get_data('insurance')

# init setup using OOP API
from pycaret.regression import RegressionExperiment
reg1 = RegressionExperiment()
reg1.setup(data, target = 'charges', session_id = 123)

# compare models
best = compare_models()

# set OOP experiment as functional
set_current_experiment(reg1)