pull
返回最后打印的评分网格。在任何训练函数之后使用 pull
函数可以将评分网格存储在 pandas.DataFrame
中。
示例
复制 # loading dataset
from pycaret.datasets import get_data
data = get_data('diabetes')
# init setup
from pycaret.classification import *
clf1 = setup(data, target = 'Class variable')
# compare models
best_model = compare_models()
# get the scoring grid
results = pull()
复制 type(results)
# >>> pandas.core.frame.DataFrame
models
返回一个表格,其中包含模型库中导入模块中的所有可用模型。
示例
复制 # loading dataset
from pycaret.datasets import get_data
data = get_data('diabetes')
# init setup
from pycaret.classification import *
clf1 = setup(data, target = 'Class variable')
# check model library
models()
如果你想查看更多信息,可以传递 internal=True
参数。
复制 # loading dataset
from pycaret.datasets import get_data
data = get_data('diabetes')
# init setup
from pycaret.classification import *
clf1 = setup(data, target = 'Class variable')
# check model library
models(internal = True)
get_config
示例
复制 # load dataset
from pycaret.datasets import get_data
data = get_data('diabetes')
# init setup
from pycaret.classification import *
clf1 = setup(data, target = 'Class variable')
# get X_train
get_config('X_train')
使用 get_config
检查所有可访问参数
复制 # check all available param
get_config()
get_config
函数可访问的变量
'variable_and_property_keys'
set_config
此函数重置全局变量。
示例
复制 # load dataset
from pycaret.datasets import get_data
data = get_data('diabetes')
# init setup
from pycaret.classification import *
clf1 = setup(data, target = 'Class variable', session_id = 123)
# reset environment seed
set_config('seed', 999)
get_metrics
返回指标容器中所有可用指标的表格。所有这些指标都用于交叉验证。
复制 # load dataset
from pycaret.datasets import get_data
data = get_data('diabetes')
# init setup
from pycaret.classification import *
clf1 = setup(data, target = 'Class variable', session_id = 123)
# get metrics
get_metrics()
add_metric
将自定义指标添加到指标容器。
复制 # load dataset
from pycaret.datasets import get_data
data = get_data('diabetes')
# init setup
from pycaret.classification import *
clf1 = setup(data, target = 'Class variable', session_id = 123)
# add metric
from sklearn.metrics import log_loss
add_metric('logloss', 'Log Loss', log_loss, greater_is_better = False)
现在,如果你检查指标容器
remove_metric
从指标容器中移除一个指标。
复制 # remove metric
remove_metric('logloss')
无输出。我们再次检查指标容器。
automl
此函数根据 optimize
参数,从当前设置中所有已训练的模型中返回最佳模型。可以使用 get_metrics
函数访问评估的指标。
示例
复制 # load dataset
from pycaret.datasets import get_data
data = get_data('diabetes')
# init setup
from pycaret.classification import *
clf1 = setup(data, target = 'Class variable')
# compare models
top5 = compare_models(n_select = 5)
# tune models
tuned_top5 = [tune_model(i) for i in top5]
# ensemble models
bagged_top5 = [ensemble_model(i) for i in tuned_top5]
# blend models
blender = blend_models(estimator_list = top5)
# stack models
stacker = stack_models(estimator_list = top5)
# automl
best = automl(optimize = 'Recall')
print(best)
get_logs
示例
复制 # load dataset
from pycaret.datasets import get_data
data = get_data('diabetes')
# init setup
from pycaret.classification import *
clf1 = setup(data, target = 'Class variable', log_experiment = True, experiment_name = 'diabetes1')
# compare models
top5 = compare_models()
# check ML logs
get_logs()
get_current_experiment
获取当前实验对象并返回一个类。当你使用函数式 API 并想切换到面向对象 API 时,这很有用。
复制 # loading dataset
from pycaret.datasets import get_data
data = get_data('insurance')
# init setup using functional API
from pycaret.regression import *
s = setup(data, target = 'charges', session_id = 123)
# compare models
best = compare_models()
# return OOP class for current functional experiment
reg1 = get_current_experiment()
set_current_experiment
将使用面向对象 API 创建的当前实验设置为与函数式 API 一起使用。
复制 # loading dataset
from pycaret.datasets import get_data
data = get_data('insurance')
# init setup using OOP API
from pycaret.regression import RegressionExperiment
reg1 = RegressionExperiment()
reg1.setup(data, target = 'charges', session_id = 123)
# compare models
best = compare_models()
# set OOP experiment as functional
set_current_experiment(reg1)