はじめに
この記事は、連載「ゼロから始める機械学習」 6本目のラスト記事となります。
前回「学習データとテストデータ」 では、データを分割する必要性について理解し、train_test_splitを実装しました。
これで基本的な機械学習の流れを理解できたのではないでしょうか。
実はこれまでに実装してきた
- ロジスティック回帰
- train_test_split
はscikit-learnライブラリに実装されています。
勉強のためにNumPyを用いてきましたが、実際のシーンではscikit-learnを使うことも多いでしょう。そこで、次回はこれらの内容をscikit-learnを用いて実装し直してみます。
実装
実は説明すべき箇所はほとんどありません。
これまでの実装のインターフェイスはscikit-learnに合わせていたためです。
1 | from sklearn.datasets import load_iris |
1 | from sklearn.model_selection import train_test_split |
1 | from sklearn.linear_model import LogisticRegression |
インターフェイスを合わせたと言いましたが、厳密には私たちが実装したpredictは確率を返します一方、scikit-learnのpredictは0または1を返す点が異なるので注意してください。
前回のコードと比較すると一目瞭然、かなり簡単に実装できました!
まとめ
お疲れ様でした。
連載のゴールであった簡単な機械学習プログラムの実装ができるレベルに達したでしょうか。
ここまで着いてこれた方であれば、きっとプログラムが実装できる!
さて、原理を理解しながらNumPyで実装する方法を学んだので、今度はscikit-learnを使いこなせるようにステップアップしましょう。
では、scikit-learnを用いて機械学習について学んでいきます。
では、データ分析と機械学習の関係についてまとめています。
記事情報
- 投稿日:2020年3月31日
- 最終更新日:2020年3月31日