前回の記事で不動産価格の予測アプリの紹介させていただきました。ある程度の精度で予測はできるのですが、もう少し精度をあげられないかと思い、得られた情報から説明変数としてのパラメーターの追加の検討を行ってみました。
以下は一連の全体のコードです。
前半はこれまでに紹介したように築年数の計算のコードになります。コード3〜7が今回あらたに説明変数として組み込むため数値化(パラメーター化)をおこなったものになります。(カテゴライズ変数として扱う方法もありますが、その結果はまた別の機会に紹介したいと思います。結局どちらも良い結果にはなりませんでしたが・・・)
コード3では建物構造が不動産価格に与える影響を数値化しています。参考数値は構造と坪単価の数値で単位は万円/坪の数値を採用しています。
コード4,5では接道の方角を数値化しています。こちらも前面道路と土地価格の資料から南向きの角が評価額が高くなる形で数値化しています。
最後は道路の種類です。こちらは参考になる資料はなかったので主観的な数値付となっていますが、公道の方が若干評価値が高くなり形で数値付を行っています。
以上のデータ処理をこれまでに収集したデータを行い、あたらに説明変数としてパラメータ化を行いました。実際に作成したデータでのデータフレームの表示の一例は以下のようになります。
構造単価、道路方位分類、道路分類が新たにパラメータとして加わっています。
これらを用いて、新たにLightGBMでモデル化の検討を行いましたが、結果については次回の記事としたいと思います。