Toad致力于促进模型开发过程,特别是对于记分卡。它提供了整个过程的直观功能,从EDA、特征工程和选择等,到结果验证和记分卡转换。其关键功能简化了最关键和最耗时的过程,例如特征选择和精细分档。
Toad 是专为工业界模型开发设计的Python工具包,特别针对评分卡的开发。Toad 的功能覆盖了建模全流程,从 EDA、特征工程、特征筛选 到 模型验证和评分卡转化。Toad 的主要功能极大简化了建模中最重要最费时的流程,即特征筛选和分箱。
主要特点 ·主要功能
以下展示了toad工具的一些最受欢迎的功能,有关更详细的演示和用户指南,请参阅教程。
以下部分简单介绍了toad工具最受欢迎的一些功能,具体的使用方法和使用教程,请详见文档部分。
所有特征的简单 IV 计算 ·一键算IV:
toad.quality(data,'target',iv_only=True)
根据标准进行初步选拔 ·根据特定条件的初步变量筛选;
和逐步特征选择(使用优化算法) ·优化过的逐步回归:
selected_data = toad.selection.select(data,target = 'target', empty = 0.5, iv = 0.02, corr = 0.7, return_drop=True, exclude=['ID','month'])
final_data = toad.selection.stepwise(data_woe,target = 'target', estimator='ols', direction = 'both', criterion = 'aic', exclude = to_drop)
具有可视化功能的可靠精细分档 ·分箱及可视化:
# Chi-squared fine binning
c = toad.transform.Combiner()
c.fit(data_selected.drop(to_drop, axis=1), y = 'target', method = 'chi', min_samples = 0.05)
print(c.export())
# Visualisation to check binning results
col = 'feature_name'
bin_plot(c.transform(data_selected[[col,'target']], labels=True), x=col, target='target')
直观的模型结果展示 ·模型结果展示:
toad.metrics.KS_bucket(pred_proba, final_data['target'], bucket=10, method = 'quantile')
一键记分卡转换 ·评分卡转化:
card = toad.ScoreCard(
combiner = c,
transer = transer,
class_weight = 'balanced',
C=0.1,
base_score = 600,
base_odds = 35 ,
pdo = 60,
rate = 2
)
card.fit(final_data[col], final_data['target'])
print(card.export())
上一条:minitab软件收费吗
下一条:toad data modeler