あるケミストの独り言(winchemwinの日記)

ケミスト(化学者)の視点で、面白そうな情報(シミュレーション関係など)を発信

機械学習による予測モデル作成(我が家の電気使用量 その1-2)

 

 この前の記事で我が家の電気使用量と気象データとの相関について、データの前処理について紹介しました。今回は実際の解析と解析結果の表示について紹介したいと思います。

 

sklearn による解析準備


 まず、機械学習を行うにあたり、目的変数と説明変数を設定しています。先の記事にも記載したようにウィークデイと週末では電気使用量に大きな差がありますので、それぞれのケースで機械学習のモデル作成を検討しています。

 続いてsklearn からモデルのインポートを行っています。今回はシンプルな'linear model'を選択しています。その後、データを学習用の訓練データとテストデータに分割して(train_test_split)準備は完了です。

  以下は休日データを使った学習とその結果の表示になります。

機械学習の実施 1

学習ですがlinear model で回帰モードで学習を行っています(fit)。また学習結果の確認ですが、回帰分析の精度評価指標となる決定係数(R2)と関係係数で確認を行い、プリントアウトしています。

 

 

 

学習結果の表示

 学習結果ですが、見ていただいたらわかるように(上段が訓練データの決定係数、下段が学習データの決定係数)、決定係数としては非常に悪い値となっています。また説明変数の寄与を示す関係係数も算出していますが、あまり良いモデルではないので、意味はないですね。

 次回以降、より良いモデルの作成の検討について、いくつか実施した内容について紹介してゆきたいと思います。