Files
qsar/1d-qsar/cuda/RFE_cuml_permutation.log
mm644706215 4cb2d9f56c add 1dqsar
2025-03-03 20:23:09 +08:00

399 lines
21 KiB
Plaintext
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
(rapids-25.02) root@DESK4090:~/project/qsar/1d-qsar/cuda# python RFE_cuml_permutation.py
训练样本数: 81, 特征数量: 156
/root/micromamba/envs/rapids-25.02/lib/python3.12/site-packages/cuml/internals/api_decorators.py:363: UserWarning: For reproducible results in Random Forest Classifier or for almost reproducible results in Random Forest Regressor, n_streams=1 is recommended. If n_streams is > 1, results may vary due to stream/thread timing differences, even when random_state is set
return init_func(self, *args, **kwargs)
/root/micromamba/envs/rapids-25.02/lib/python3.12/site-packages/cuml/internals/api_decorators.py:188: UserWarning: The number of bins, `n_bins` is greater than the number of samples used for training. Changing `n_bins` to number of training samples.
ret = func(*args, **kwargs)
/root/micromamba/envs/rapids-25.02/lib/python3.12/site-packages/cuml/internals/api_decorators.py:188: UserWarning: To use pickling first train using float32 data to fit the estimator
ret = func(*args, **kwargs)
n_estimators: 50, CV MSE: 5.2602
n_estimators: 100, CV MSE: 5.0974
n_estimators: 150, CV MSE: 5.1422
n_estimators: 200, CV MSE: 5.0988
n_estimators: 250, CV MSE: 4.9330
n_estimators: 300, CV MSE: 4.9259
n_estimators: 350, CV MSE: 4.9253
/root/project/qsar/1d-qsar/cuda/RFE_cuml_permutation.py:143: UserWarning: Glyph 19981 (\N{CJK UNIFIED IDEOGRAPH-4E0D}) missing from font(s) DejaVu Sans.
plt.savefig("tree_vs_cv_mse.png", dpi=300)
/root/project/qsar/1d-qsar/cuda/RFE_cuml_permutation.py:143: UserWarning: Glyph 21516 (\N{CJK UNIFIED IDEOGRAPH-540C}) missing from font(s) DejaVu Sans.
plt.savefig("tree_vs_cv_mse.png", dpi=300)
/root/project/qsar/1d-qsar/cuda/RFE_cuml_permutation.py:143: UserWarning: Glyph 26641 (\N{CJK UNIFIED IDEOGRAPH-6811}) missing from font(s) DejaVu Sans.
plt.savefig("tree_vs_cv_mse.png", dpi=300)
/root/project/qsar/1d-qsar/cuda/RFE_cuml_permutation.py:143: UserWarning: Glyph 25968 (\N{CJK UNIFIED IDEOGRAPH-6570}) missing from font(s) DejaVu Sans.
plt.savefig("tree_vs_cv_mse.png", dpi=300)
/root/project/qsar/1d-qsar/cuda/RFE_cuml_permutation.py:143: UserWarning: Glyph 37327 (\N{CJK UNIFIED IDEOGRAPH-91CF}) missing from font(s) DejaVu Sans.
plt.savefig("tree_vs_cv_mse.png", dpi=300)
/root/project/qsar/1d-qsar/cuda/RFE_cuml_permutation.py:143: UserWarning: Glyph 19979 (\N{CJK UNIFIED IDEOGRAPH-4E0B}) missing from font(s) DejaVu Sans.
plt.savefig("tree_vs_cv_mse.png", dpi=300)
/root/project/qsar/1d-qsar/cuda/RFE_cuml_permutation.py:143: UserWarning: Glyph 30340 (\N{CJK UNIFIED IDEOGRAPH-7684}) missing from font(s) DejaVu Sans.
plt.savefig("tree_vs_cv_mse.png", dpi=300)
/root/project/qsar/1d-qsar/cuda/RFE_cuml_permutation.py:143: UserWarning: Glyph 20132 (\N{CJK UNIFIED IDEOGRAPH-4EA4}) missing from font(s) DejaVu Sans.
plt.savefig("tree_vs_cv_mse.png", dpi=300)
/root/project/qsar/1d-qsar/cuda/RFE_cuml_permutation.py:143: UserWarning: Glyph 21449 (\N{CJK UNIFIED IDEOGRAPH-53C9}) missing from font(s) DejaVu Sans.
plt.savefig("tree_vs_cv_mse.png", dpi=300)
/root/project/qsar/1d-qsar/cuda/RFE_cuml_permutation.py:143: UserWarning: Glyph 39564 (\N{CJK UNIFIED IDEOGRAPH-9A8C}) missing from font(s) DejaVu Sans.
plt.savefig("tree_vs_cv_mse.png", dpi=300)
/root/project/qsar/1d-qsar/cuda/RFE_cuml_permutation.py:143: UserWarning: Glyph 35777 (\N{CJK UNIFIED IDEOGRAPH-8BC1}) missing from font(s) DejaVu Sans.
plt.savefig("tree_vs_cv_mse.png", dpi=300)
最佳随机森林树数量确定为: 350
当前特征数: 156, CV MSE: 4.9253
剔除特征索引: 133置换重要性: -0.0004
当前特征数: 155, CV MSE: 4.9970
剔除特征索引: 124置换重要性: -0.0009
当前特征数: 154, CV MSE: 4.7611
剔除特征索引: 152置换重要性: -0.0006
当前特征数: 153, CV MSE: 4.7928
剔除特征索引: 47置换重要性: -0.0001
当前特征数: 152, CV MSE: 4.7032
剔除特征索引: 107置换重要性: -0.0010
当前特征数: 151, CV MSE: 4.7571
剔除特征索引: 155置换重要性: -0.0000
当前特征数: 150, CV MSE: 4.7501
剔除特征索引: 11置换重要性: -0.0004
当前特征数: 149, CV MSE: 4.8415
剔除特征索引: 52置换重要性: -0.0001
当前特征数: 148, CV MSE: 4.7807
剔除特征索引: 143置换重要性: -0.0001
当前特征数: 147, CV MSE: 4.7937
剔除特征索引: 12置换重要性: -0.0008
当前特征数: 146, CV MSE: 4.7589
剔除特征索引: 2置换重要性: -0.0007
当前特征数: 145, CV MSE: 4.8444
剔除特征索引: 125置换重要性: -0.0000
当前特征数: 144, CV MSE: 4.8518
剔除特征索引: 119置换重要性: -0.0019
当前特征数: 143, CV MSE: 4.6953
剔除特征索引: 67置换重要性: -0.0000
当前特征数: 142, CV MSE: 4.7689
剔除特征索引: 77置换重要性: -0.0001
当前特征数: 141, CV MSE: 4.7446
剔除特征索引: 55置换重要性: -0.0001
当前特征数: 140, CV MSE: 4.8110
剔除特征索引: 66置换重要性: -0.0011
当前特征数: 139, CV MSE: 4.7815
剔除特征索引: 0置换重要性: 0.0000
当前特征数: 138, CV MSE: 4.8477
剔除特征索引: 148置换重要性: -0.0003
当前特征数: 137, CV MSE: 4.7395
剔除特征索引: 48置换重要性: -0.0000
当前特征数: 136, CV MSE: 4.6840
剔除特征索引: 150置换重要性: -0.0000
当前特征数: 135, CV MSE: 4.8117
剔除特征索引: 60置换重要性: -0.0001
当前特征数: 134, CV MSE: 4.7988
剔除特征索引: 149置换重要性: -0.0000
当前特征数: 133, CV MSE: 4.7597
剔除特征索引: 76置换重要性: -0.0000
当前特征数: 132, CV MSE: 4.7059
剔除特征索引: 69置换重要性: -0.0000
当前特征数: 131, CV MSE: 4.7498
剔除特征索引: 51置换重要性: -0.0000
当前特征数: 130, CV MSE: 4.7434
剔除特征索引: 142置换重要性: -0.0000
当前特征数: 129, CV MSE: 4.7211
剔除特征索引: 105置换重要性: -0.0001
当前特征数: 128, CV MSE: 4.8107
剔除特征索引: 53置换重要性: -0.0000
当前特征数: 127, CV MSE: 4.7079
剔除特征索引: 86置换重要性: -0.0009
当前特征数: 126, CV MSE: 4.7144
剔除特征索引: 136置换重要性: -0.0000
当前特征数: 125, CV MSE: 4.7590
剔除特征索引: 113置换重要性: -0.0013
当前特征数: 124, CV MSE: 4.8185
剔除特征索引: 146置换重要性: -0.0000
当前特征数: 123, CV MSE: 4.7051
剔除特征索引: 153置换重要性: -0.0000
当前特征数: 122, CV MSE: 4.6048
剔除特征索引: 138置换重要性: -0.0006
当前特征数: 121, CV MSE: 4.5805
剔除特征索引: 147置换重要性: -0.0000
当前特征数: 120, CV MSE: 4.8172
剔除特征索引: 62置换重要性: -0.0001
当前特征数: 119, CV MSE: 4.8393
剔除特征索引: 127置换重要性: -0.0002
当前特征数: 118, CV MSE: 4.7780
剔除特征索引: 1置换重要性: 0.0000
当前特征数: 117, CV MSE: 4.7227
剔除特征索引: 3置换重要性: 0.0000
当前特征数: 116, CV MSE: 4.7864
剔除特征索引: 4置换重要性: 0.0000
当前特征数: 115, CV MSE: 4.6388
剔除特征索引: 5置换重要性: 0.0000
当前特征数: 114, CV MSE: 4.5150
剔除特征索引: 140置换重要性: -0.0001
当前特征数: 113, CV MSE: 4.6324
剔除特征索引: 6置换重要性: 0.0000
当前特征数: 112, CV MSE: 4.7494
剔除特征索引: 24置换重要性: -0.0009
当前特征数: 111, CV MSE: 4.6774
剔除特征索引: 80置换重要性: -0.0001
当前特征数: 110, CV MSE: 4.7463
剔除特征索引: 70置换重要性: -0.0000
当前特征数: 109, CV MSE: 4.7211
剔除特征索引: 54置换重要性: -0.0000
当前特征数: 108, CV MSE: 4.6060
剔除特征索引: 7置换重要性: 0.0000
当前特征数: 107, CV MSE: 4.5989
剔除特征索引: 88置换重要性: -0.0001
当前特征数: 106, CV MSE: 4.5530
剔除特征索引: 106置换重要性: -0.0008
当前特征数: 105, CV MSE: 4.6703
剔除特征索引: 8置换重要性: 0.0000
当前特征数: 104, CV MSE: 4.4274
剔除特征索引: 145置换重要性: -0.0000
当前特征数: 103, CV MSE: 4.7372
剔除特征索引: 9置换重要性: 0.0000
当前特征数: 102, CV MSE: 4.6272
剔除特征索引: 129置换重要性: -0.0004
当前特征数: 101, CV MSE: 4.6820
剔除特征索引: 10置换重要性: 0.0000
当前特征数: 100, CV MSE: 4.5780
剔除特征索引: 13置换重要性: -0.0000
当前特征数: 99, CV MSE: 4.6734
剔除特征索引: 139置换重要性: -0.0002
当前特征数: 98, CV MSE: 4.6922
剔除特征索引: 50置换重要性: -0.0000
当前特征数: 97, CV MSE: 4.6520
剔除特征索引: 134置换重要性: -0.0002
当前特征数: 96, CV MSE: 4.6574
剔除特征索引: 14置换重要性: 0.0000
当前特征数: 95, CV MSE: 4.7120
剔除特征索引: 15置换重要性: 0.0000
当前特征数: 94, CV MSE: 4.6882
剔除特征索引: 16置换重要性: 0.0000
当前特征数: 93, CV MSE: 4.5839
剔除特征索引: 17置换重要性: 0.0000
当前特征数: 92, CV MSE: 4.6231
剔除特征索引: 18置换重要性: 0.0000
当前特征数: 91, CV MSE: 4.6144
剔除特征索引: 154置换重要性: 0.0000
当前特征数: 90, CV MSE: 4.4886
剔除特征索引: 19置换重要性: 0.0000
当前特征数: 89, CV MSE: 4.5828
剔除特征索引: 20置换重要性: 0.0000
当前特征数: 88, CV MSE: 4.4967
剔除特征索引: 144置换重要性: -0.0003
当前特征数: 87, CV MSE: 4.5881
剔除特征索引: 21置换重要性: 0.0000
当前特征数: 86, CV MSE: 4.4972
剔除特征索引: 22置换重要性: 0.0000
当前特征数: 85, CV MSE: 4.5007
剔除特征索引: 137置换重要性: -0.0010
当前特征数: 84, CV MSE: 4.5097
剔除特征索引: 23置换重要性: 0.0000
当前特征数: 83, CV MSE: 4.4847
剔除特征索引: 25置换重要性: 0.0000
当前特征数: 82, CV MSE: 4.6722
剔除特征索引: 26置换重要性: 0.0000
当前特征数: 81, CV MSE: 4.5776
剔除特征索引: 27置换重要性: 0.0000
当前特征数: 80, CV MSE: 4.5790
剔除特征索引: 28置换重要性: 0.0000
当前特征数: 79, CV MSE: 4.5349
剔除特征索引: 29置换重要性: 0.0000
当前特征数: 78, CV MSE: 4.5542
剔除特征索引: 30置换重要性: 0.0000
当前特征数: 77, CV MSE: 4.5299
剔除特征索引: 31置换重要性: 0.0000
当前特征数: 76, CV MSE: 4.6087
剔除特征索引: 32置换重要性: 0.0000
当前特征数: 75, CV MSE: 4.6009
剔除特征索引: 33置换重要性: 0.0000
当前特征数: 74, CV MSE: 4.4684
剔除特征索引: 34置换重要性: 0.0000
当前特征数: 73, CV MSE: 4.5094
剔除特征索引: 35置换重要性: 0.0000
当前特征数: 72, CV MSE: 4.4700
剔除特征索引: 49置换重要性: -0.0001
当前特征数: 71, CV MSE: 4.5176
剔除特征索引: 36置换重要性: 0.0000
当前特征数: 70, CV MSE: 4.4335
剔除特征索引: 37置换重要性: -0.0000
当前特征数: 69, CV MSE: 4.4646
剔除特征索引: 38置换重要性: 0.0000
当前特征数: 68, CV MSE: 4.4792
剔除特征索引: 39置换重要性: -0.0000
当前特征数: 67, CV MSE: 4.4398
剔除特征索引: 40置换重要性: 0.0000
当前特征数: 66, CV MSE: 4.3681
剔除特征索引: 41置换重要性: 0.0001
当前特征数: 65, CV MSE: 4.3967
剔除特征索引: 42置换重要性: 0.0000
当前特征数: 64, CV MSE: 4.4340
剔除特征索引: 43置换重要性: 0.0000
当前特征数: 63, CV MSE: 4.4324
剔除特征索引: 44置换重要性: 0.0000
当前特征数: 62, CV MSE: 4.5365
剔除特征索引: 45置换重要性: 0.0000
当前特征数: 61, CV MSE: 4.5531
剔除特征索引: 46置换重要性: 0.0000
当前特征数: 60, CV MSE: 4.4241
剔除特征索引: 56置换重要性: 0.0000
当前特征数: 59, CV MSE: 4.4180
剔除特征索引: 57置换重要性: -0.0000
当前特征数: 58, CV MSE: 4.3972
剔除特征索引: 58置换重要性: 0.0000
当前特征数: 57, CV MSE: 4.2306
剔除特征索引: 59置换重要性: 0.0000
当前特征数: 56, CV MSE: 4.2263
剔除特征索引: 61置换重要性: 0.0000
当前特征数: 55, CV MSE: 4.4408
剔除特征索引: 63置换重要性: 0.0002
当前特征数: 54, CV MSE: 4.4805
剔除特征索引: 64置换重要性: 0.0003
当前特征数: 53, CV MSE: 4.4570
剔除特征索引: 65置换重要性: 0.0000
当前特征数: 52, CV MSE: 4.4523
剔除特征索引: 68置换重要性: -0.0000
当前特征数: 51, CV MSE: 4.4382
剔除特征索引: 71置换重要性: 0.0000
当前特征数: 50, CV MSE: 4.4065
剔除特征索引: 72置换重要性: 0.0000
当前特征数: 49, CV MSE: 4.3169
剔除特征索引: 73置换重要性: 0.0000
当前特征数: 48, CV MSE: 4.2661
剔除特征索引: 74置换重要性: 0.0000
当前特征数: 47, CV MSE: 4.3875
剔除特征索引: 75置换重要性: 0.0004
当前特征数: 46, CV MSE: 4.3418
剔除特征索引: 78置换重要性: -0.0000
当前特征数: 45, CV MSE: 4.4599
剔除特征索引: 79置换重要性: 0.0000
当前特征数: 44, CV MSE: 4.5502
剔除特征索引: 81置换重要性: 0.0000
当前特征数: 43, CV MSE: 4.4299
剔除特征索引: 135置换重要性: 0.0025
当前特征数: 42, CV MSE: 4.4397
剔除特征索引: 82置换重要性: 0.0000
当前特征数: 41, CV MSE: 4.4255
剔除特征索引: 83置换重要性: 0.0003
当前特征数: 40, CV MSE: 4.4042
剔除特征索引: 84置换重要性: 0.0000
当前特征数: 39, CV MSE: 4.4017
剔除特征索引: 85置换重要性: 0.0000
当前特征数: 38, CV MSE: 4.3463
剔除特征索引: 87置换重要性: 0.0003
当前特征数: 37, CV MSE: 4.5079
剔除特征索引: 89置换重要性: -0.0001
当前特征数: 36, CV MSE: 4.4404
剔除特征索引: 90置换重要性: 0.0002
当前特征数: 35, CV MSE: 4.4802
剔除特征索引: 91置换重要性: -0.0000
当前特征数: 34, CV MSE: 4.5477
剔除特征索引: 92置换重要性: 0.0000
当前特征数: 33, CV MSE: 4.5129
剔除特征索引: 93置换重要性: 0.0000
当前特征数: 32, CV MSE: 4.4643
剔除特征索引: 94置换重要性: 0.0004
当前特征数: 31, CV MSE: 4.6173
剔除特征索引: 95置换重要性: 0.0000
当前特征数: 30, CV MSE: 4.5979
剔除特征索引: 96置换重要性: 0.0002
当前特征数: 29, CV MSE: 4.4120
剔除特征索引: 97置换重要性: 0.0000
当前特征数: 28, CV MSE: 4.4958
剔除特征索引: 98置换重要性: 0.0004
当前特征数: 27, CV MSE: 4.5448
剔除特征索引: 99置换重要性: 0.0002
当前特征数: 26, CV MSE: 4.3483
剔除特征索引: 100置换重要性: 0.0014
当前特征数: 25, CV MSE: 4.3617
剔除特征索引: 101置换重要性: 0.0001
当前特征数: 24, CV MSE: 4.4947
剔除特征索引: 102置换重要性: 0.0017
当前特征数: 23, CV MSE: 4.2328
剔除特征索引: 103置换重要性: 0.0022
当前特征数: 22, CV MSE: 4.3158
剔除特征索引: 104置换重要性: 0.0000
当前特征数: 21, CV MSE: 4.3848
剔除特征索引: 108置换重要性: 0.0000
当前特征数: 20, CV MSE: 4.3861
剔除特征索引: 109置换重要性: 0.0009
当前特征数: 19, CV MSE: 4.1140
剔除特征索引: 110置换重要性: 0.0002
当前特征数: 18, CV MSE: 4.0750
剔除特征索引: 111置换重要性: 0.0000
当前特征数: 17, CV MSE: 3.9148
剔除特征索引: 112置换重要性: 0.0004
当前特征数: 16, CV MSE: 4.0441
剔除特征索引: 114置换重要性: 0.0016
当前特征数: 15, CV MSE: 3.9886
剔除特征索引: 115置换重要性: 0.0000
当前特征数: 14, CV MSE: 4.1169
剔除特征索引: 116置换重要性: 0.0000
当前特征数: 13, CV MSE: 4.1846
剔除特征索引: 117置换重要性: 0.0000
当前特征数: 12, CV MSE: 4.2129
剔除特征索引: 118置换重要性: 0.0020
当前特征数: 11, CV MSE: 4.2006
剔除特征索引: 120置换重要性: 0.0024
当前特征数: 10, CV MSE: 3.9221
剔除特征索引: 121置换重要性: 0.0032
当前特征数: 9, CV MSE: 3.9000
剔除特征索引: 122置换重要性: 0.0015
当前特征数: 8, CV MSE: 4.1202
剔除特征索引: 123置换重要性: 0.0020
当前特征数: 7, CV MSE: 4.0491
剔除特征索引: 126置换重要性: 0.0002
当前特征数: 6, CV MSE: 3.8452
剔除特征索引: 128置换重要性: 0.0003
当前特征数: 5, CV MSE: 3.8135
剔除特征索引: 131置换重要性: 0.0013
当前特征数: 4, CV MSE: 3.8181
剔除特征索引: 130置换重要性: 0.0106
当前特征数: 3, CV MSE: 3.9118
剔除特征索引: 132置换重要性: -0.0000
当前特征数: 2, CV MSE: 3.9524
剔除特征索引: 141置换重要性: 0.0000
当前特征数: 1, CV MSE: 3.9524
手动RFECV选择了 5 个特征CV MSE: 3.8135
选定特征名称: ['fr_Ndealkylation2', 'fr_aldehyde', 'fr_alkyl_halide', 'fr_halogen', 'fr_piperdine']
/root/project/qsar/1d-qsar/cuda/RFE_cuml_permutation.py:208: UserWarning: Glyph 34987 (\N{CJK UNIFIED IDEOGRAPH-88AB}) missing from font(s) DejaVu Sans.
plt.savefig("rfecv_perm_importance.png", dpi=300)
/root/project/qsar/1d-qsar/cuda/RFE_cuml_permutation.py:208: UserWarning: Glyph 21076 (\N{CJK UNIFIED IDEOGRAPH-5254}) missing from font(s) DejaVu Sans.
plt.savefig("rfecv_perm_importance.png", dpi=300)
/root/project/qsar/1d-qsar/cuda/RFE_cuml_permutation.py:208: UserWarning: Glyph 38500 (\N{CJK UNIFIED IDEOGRAPH-9664}) missing from font(s) DejaVu Sans.
plt.savefig("rfecv_perm_importance.png", dpi=300)
/root/project/qsar/1d-qsar/cuda/RFE_cuml_permutation.py:208: UserWarning: Glyph 29305 (\N{CJK UNIFIED IDEOGRAPH-7279}) missing from font(s) DejaVu Sans.
plt.savefig("rfecv_perm_importance.png", dpi=300)
/root/project/qsar/1d-qsar/cuda/RFE_cuml_permutation.py:208: UserWarning: Glyph 24449 (\N{CJK UNIFIED IDEOGRAPH-5F81}) missing from font(s) DejaVu Sans.
plt.savefig("rfecv_perm_importance.png", dpi=300)
/root/project/qsar/1d-qsar/cuda/RFE_cuml_permutation.py:208: UserWarning: Glyph 30340 (\N{CJK UNIFIED IDEOGRAPH-7684}) missing from font(s) DejaVu Sans.
plt.savefig("rfecv_perm_importance.png", dpi=300)
/root/project/qsar/1d-qsar/cuda/RFE_cuml_permutation.py:208: UserWarning: Glyph 32622 (\N{CJK UNIFIED IDEOGRAPH-7F6E}) missing from font(s) DejaVu Sans.
plt.savefig("rfecv_perm_importance.png", dpi=300)
/root/project/qsar/1d-qsar/cuda/RFE_cuml_permutation.py:208: UserWarning: Glyph 25442 (\N{CJK UNIFIED IDEOGRAPH-6362}) missing from font(s) DejaVu Sans.
plt.savefig("rfecv_perm_importance.png", dpi=300)
/root/project/qsar/1d-qsar/cuda/RFE_cuml_permutation.py:208: UserWarning: Glyph 37325 (\N{CJK UNIFIED IDEOGRAPH-91CD}) missing from font(s) DejaVu Sans.
plt.savefig("rfecv_perm_importance.png", dpi=300)
/root/project/qsar/1d-qsar/cuda/RFE_cuml_permutation.py:208: UserWarning: Glyph 35201 (\N{CJK UNIFIED IDEOGRAPH-8981}) missing from font(s) DejaVu Sans.
plt.savefig("rfecv_perm_importance.png", dpi=300)
/root/project/qsar/1d-qsar/cuda/RFE_cuml_permutation.py:208: UserWarning: Glyph 24615 (\N{CJK UNIFIED IDEOGRAPH-6027}) missing from font(s) DejaVu Sans.
plt.savefig("rfecv_perm_importance.png", dpi=300)
/root/project/qsar/1d-qsar/cuda/RFE_cuml_permutation.py:208: UserWarning: Glyph 36807 (\N{CJK UNIFIED IDEOGRAPH-8FC7}) missing from font(s) DejaVu Sans.
plt.savefig("rfecv_perm_importance.png", dpi=300)
/root/project/qsar/1d-qsar/cuda/RFE_cuml_permutation.py:208: UserWarning: Glyph 31243 (\N{CJK UNIFIED IDEOGRAPH-7A0B}) missing from font(s) DejaVu Sans.
plt.savefig("rfecv_perm_importance.png", dpi=300)
/root/project/qsar/1d-qsar/cuda/RFE_cuml_permutation.py:208: UserWarning: Glyph 20013 (\N{CJK UNIFIED IDEOGRAPH-4E2D}) missing from font(s) DejaVu Sans.
plt.savefig("rfecv_perm_importance.png", dpi=300)
/root/project/qsar/1d-qsar/cuda/RFE_cuml_permutation.py:208: UserWarning: Glyph 21464 (\N{CJK UNIFIED IDEOGRAPH-53D8}) missing from font(s) DejaVu Sans.
plt.savefig("rfecv_perm_importance.png", dpi=300)
/root/project/qsar/1d-qsar/cuda/RFE_cuml_permutation.py:208: UserWarning: Glyph 21270 (\N{CJK UNIFIED IDEOGRAPH-5316}) missing from font(s) DejaVu Sans.
plt.savefig("rfecv_perm_importance.png", dpi=300)
/root/project/qsar/1d-qsar/cuda/RFE_cuml_permutation.py:208: UserWarning: Glyph 36845 (\N{CJK UNIFIED IDEOGRAPH-8FED}) missing from font(s) DejaVu Sans.
plt.savefig("rfecv_perm_importance.png", dpi=300)
/root/project/qsar/1d-qsar/cuda/RFE_cuml_permutation.py:208: UserWarning: Glyph 20195 (\N{CJK UNIFIED IDEOGRAPH-4EE3}) missing from font(s) DejaVu Sans.
plt.savefig("rfecv_perm_importance.png", dpi=300)
/root/project/qsar/1d-qsar/cuda/RFE_cuml_permutation.py:208: UserWarning: Glyph 27425 (\N{CJK UNIFIED IDEOGRAPH-6B21}) missing from font(s) DejaVu Sans.
plt.savefig("rfecv_perm_importance.png", dpi=300)
/root/project/qsar/1d-qsar/cuda/RFE_cuml_permutation.py:208: UserWarning: Glyph 25968 (\N{CJK UNIFIED IDEOGRAPH-6570}) missing from font(s) DejaVu Sans.
plt.savefig("rfecv_perm_importance.png", dpi=300)
最终模型最佳特征、n_estimators=350CV MSE: 3.8135
在 RFECV 的过程中,并不是直接选择“置换重要性最高”的特征,而是逐步剔除那些对模型贡献较小(即剔除后 CV MSE 变化最小)的特征。最终留下的这 5 个特征,正是当它们保留时能让交叉验证的均方误差最低的那一组特征组合。
换句话说,这 5 个特征并不是单独“置换重要性很大”而是删除其他特征后模型的预测性能下降得比较多。如果删除其中任一特征CV MSE 会升高,因此保留它们可以达到最佳性能。所以最终只剩下这 5 个特征,是因为它们在整体组合上对预测任务最为关键。