scikit-learn 0.24でよく使う便利な機能に関するメモです
sklearn.semi_supervised.SelfTrainingClassifier
教師あり分類器を半教師あり分類器として機能させるクラスです。
アルゴリズムの概要は以下のようになります。
- ラベル付きデータで学習
- ラベルのないデータを予測
- 予測値をトレーニングセットに追加
そのため、教師なし学習のように全くラベルが付いていないデータでは学習させることができないので注意して下さい。
1 | import numpy as np |
predict_proba
メソッドを持つ、全ての分類器で利用が可能です。疑似ラベルを付与する際に閾値を用いて付与するかを決めるため、predict_proba
が必要なのだと思います。
おまけ
半教師あり学習に関する記述がある書籍です。
- 機械学習 100+ページ エッセンス
記事情報
- 投稿日:2021年8月20日
- 最終更新日:2021年8月20日