当前位置:首页 >> 环保新闻

分享几个Sklearn模块中会不为人知又超级好用的API函数

来源:环保新闻   2023年03月01日 12:18

ure(figsize=(12, 8), dpi=200)

plot_tree(clf, feature_names=df.feature_names,

class_names=df.target_names);

output

HuberRegressor重返

数据集集当里要是长期存在零点都会大大增大最后基础训练借助于来建模的效率,大多数的情况下,我们是通过可以通过一些正则表达式来寻找这些零点然后将其去铲除,当然这里还有介绍的HuberRegressor重返正则表达式给我们提供了另外一个思路,它对于零点的处理方式是在基础训练近似的时候给予这些零点较少的权重,当里的epsilon实例来控制应当是被视作是零点的存量,值越小明确指借助于对零点的鲁棒性就越强。明确请看下图

当epsilon的值之比1.35、1.5以及1.75的时候,受到零点的电磁干扰都相比较小。该正则表达式明确的用作作法以及实例的明确指借助于可以参照其此前文件格式。

_model.HuberRegressor.html

外观上选取 SelectFromModel

另外一种外观上选取的正则表达式是SelectFromModel,和上述提到的表达式式外观上避免法来选取外观上相同的是,它在数据集量较大的情况下应用于的相比较多因为它有非常低的计算变为本,只要建模里区别于feature_importance_物件或者是coef_物件都可以和SelectFromModel正则表达式相容,比如说字符如下

from sklearn.feature_selection import SelectFromModel

from sklearn.ensemble import ExtraTreesRegressor

# 随机分解一些有假数据集

X, y = make_regression(n_samples=int(1e4), n_features=50, n_informative=15)

# 调用建模

selector = SelectFromModel(estimator=ExtraTreesRegressor()).fit(X, y)

# 选取借助于最主要的建模

selector.transform(X).shape

output

(10000, 9)

手指僵硬是怎么回事
孕妇腹泻可以吃什么
安必丁的主要功能
怀化哪个医院治疗白癜风最好
什么是重组蛋白药物
标签:函数模块
友情链接