sklearn 學習

2022-09-23 09:57:04 字數 1050 閱讀 2241

6.1.1.1 usage

6.1.1.1.1 建立

pipeline()或 make_pipeline

6.1.1.1.2 訪問步驟

pipe.steps[0]

6.1.1.1.3 巢狀引數

__6.1.1.2 筆記

6.1.1.3 快取transformersprocessing.scale() 標準化

standardscaler().fit(train)獲得變換器,可以應用到測試集scaler.transform(test)

6.3.1.1 縮放到固定range 可以minmaxscaler或maxabsscaler

6.3.1.2 縮放稀疏資料

稀疏資料可以用maxabsscaler 以及 standardscaler(但是需要with_mean=false)

6.3.1.3 帶著離群值縮放

可以用robustscaler

6.3.1.4 中心化核矩陣

kernelcenter

6.3.2.1 對映到均勻分佈 分位點變換quantiletransformer 沒看懂

6.3.2.2 對映到高斯分佈

powertransformer提供兩個變換

yeo-johnson 變換

box-cox 變換 智慧用於正整數

ordinalencoder 序號編碼

onehotencoder(categories=)

drop 引數沒看懂

6.3.5.1 k-裝箱離散

preprocessing.kbinsdiscretizer(n_bins=,encode='ordinal')

6.3.5.2 特徵二值化

preprocessing.binarizer(threshold=1.1).fit(x)

poly = polynomialfeatures(2)

poly.fit_transform(x)

transformer = functiontransformer(np.log1p, validate=true)

sklearn交叉驗證2 老魚學sklearn

過擬合相當於一個人只會讀書,卻不知如何利用知識進行變通。 相當於他把考試題目背得滾瓜爛熟,但一旦環境稍微有些變化,就死得很慘。 從圖形上看,...

sklearn中的pipeline

在使用sklean處理一個機器學習例項時,可能會經過資料縮放 特徵合併以及模型學習擬合等過程 並且,當問題更為複雜時,所應用到的演算法以及模...

SKlearn 模型儲存

sklearn 中 模型儲存有兩種方式,版本不同,可檢視官網,這裡只做簡單記錄 序列化 的具體用法請自行研究 from sklearn import svm from sklearn import datasets clf svm svc x y datasets load iris return ...