あるケミストの独り言(winchemwinの日記)

ケミスト(化学者)の視点で、面白そうな情報(シミュレーション関係など)を発信

機械学習による(中古)不動産価格の予測 その7 パラメーター追加(建物構造、接道、道路種類)

 前回の記事で不動産価格の予測アプリの紹介させていただきました。ある程度の精度で予測はできるのですが、もう少し精度をあげられないかと思い、得られた情報から説明変数としてのパラメーターの追加の検討を行ってみました。

 以下は一連の全体のコードです。

 前半はこれまでに紹介したように築年数の計算のコードになります。コード3〜7が今回あらたに説明変数として組み込むため数値化(パラメーター化)をおこなったものになります。(カテゴライズ変数として扱う方法もありますが、その結果はまた別の機会に紹介したいと思います。結局どちらも良い結果にはなりませんでしたが・・・)

 コード3では建物構造が不動産価格に与える影響を数値化しています。参考数値は構造と坪単価の数値で単位は万円/坪の数値を採用しています。

 コード4,5では接道の方角を数値化しています。こちらも前面道路と土地価格の資料から南向きの角が評価額が高くなる形で数値化しています。

 最後は道路の種類です。こちらは参考になる資料はなかったので主観的な数値付となっていますが、公道の方が若干評価値が高くなり形で数値付を行っています。

 

 

コード1

コード2

コード3

コード4

コード5

コード6

コード7

 

コード8

 

以上のデータ処理をこれまでに収集したデータを行い、あたらに説明変数としてパラメータ化を行いました。実際に作成したデータでのデータフレームの表示の一例は以下のようになります。

 

数値化後のデータフレーム1

 

数値化後のデータフレーム2


構造単価、道路方位分類、道路分類が新たにパラメータとして加わっています。

 これらを用いて、新たにLightGBMでモデル化の検討を行いましたが、結果については次回の記事としたいと思います。