機械学習による（中古）不動産価格の予測　その１ - あるケミストの独り言（winchemwinの日記）

　機械学習による予測として、中古不動産取引価格の予測モデルの作成を行ってみましたので、以後複数回に分けて紹介したいと思います。

　よく紹介されるモデルとしてscikit-learnを使ったボストンの住宅価格の回帰予測モデルの例が紹介されていますが、身近な例として日本のある地域の不動産の価格の予測モデルの作成を検討してみました。

　もとになる学習データですが、国土交通省から平成２１年から蓄積されている不動産の取引価格情報を使いました。こちらは国土交通省の以下に表示のページから取引時期や都道府県、市町村を選択することでcsv形式のファイルをダウンロードすることができます。平成２１年からですと約１０年間の取引データがありますので、学習データとしてはまずまずのボリュームかと思います。

　注意点ですが、不動産取引情報のデータはアンケートに基づき集約されているようなので、あくまで目安程度として考える必要があるようです（実際の価格情報は不動産関連の他の情報なども勘案する必要があるかと思いますので、その点ご留意ください）。

　今回は、あくまで機械学習のモデル作成の題材として、自分自身の興味で取り上げていますので、その点ご了承ください。