はじめに
この記事は、連載「ゼロから始める機械学習」 6本目のラスト記事となります。
前回「学習データとテストデータ」 では、データを分割する必要性について理解し、train_test_split
を実装しました。
これで基本的な機械学習の流れを理解できたのではないでしょうか。
実はこれまでに実装してきた
- ロジスティック回帰
- train_test_split
はscikit-learn
ライブラリに実装されています。
勉強のためにNumPy
を用いてきましたが、実際のシーンではscikit-learn
を使うことも多いでしょう。そこで、次回はこれらの内容をscikit-learn
を用いて実装し直してみます。
実装
実は説明すべき箇所はほとんどありません。
これまでの実装のインターフェイスはscikit-learn
に合わせていたためです。
1 | from sklearn.datasets import load_iris |
1 | from sklearn.model_selection import train_test_split |
1 | from sklearn.linear_model import LogisticRegression |
インターフェイスを合わせたと言いましたが、厳密には私たちが実装したpredict
は確率を返します一方、scikit-learn
のpredict
は0
または1
を返す点が異なるので注意してください。
前回のコードと比較すると一目瞭然、かなり簡単に実装できました!
まとめ
お疲れ様でした。
連載のゴールであった簡単な機械学習プログラムの実装ができるレベルに達したでしょうか。
ここまで着いてこれた方であれば、きっとプログラムが実装できる!
さて、原理を理解しながらNumPy
で実装する方法を学んだので、今度はscikit-learn
を使いこなせるようにステップアップしましょう。
では、scikit-learnを用いて機械学習について学んでいきます。
では、データ分析と機械学習の関係についてまとめています。
記事情報
- 投稿日:2020年3月31日
- 最終更新日:2020年3月31日