あるケミストの独り言(winchemwinの日記)

ケミスト(化学者)の視点で、面白そうな情報(シミュレーション関係など)を発信

機械学習 (モデル作成、評価など)

紫外可視吸収波長自動算出アプリ(CustumTkinter)その1

以前の記事でHOMO-LUMO軌道、屈折率の自動算出アプリを紹介してきました。今回以降別の物性値として紫外可視吸収波長の自動算出アプリを紹介してゆきたいと思います。基本的なコードはこれまで紹介してきたアプリと同様ですが、紫外可視吸収データを算出させ…

Pythonを活用した機械学習用データ作成 その3(誘電率)

前回の記事で機械学習用データとして屈折率データの算出について紹介してきました。今回はさらに屈折率データを活用した誘電率のデータ作成について紹介します。 分子の誘電率ですが、オンサガーの式を用いることで屈折率、双極子モーメントデータ等から算出…

Pythonを活用した機械学習用データ作成 その2(屈折率)

前回までの記事で機械学習用データとして分子体積データの算出について紹介してきました。今回は分子体積データを活用した屈折率のデータ作成について紹介します。 分子の屈折率ですが、ローレンツ・ローレンツ式を用いることで分子体積と分極率データから算…

Pythonを活用した機械学習用データ作成 その1(分子体積2)

前回の記事で機械学習用のデータとしてQM9のデータを活用した分子体積データの作成について紹介させていただきました。ただ、Rdkitモジュールを利用した場合計算に少し時間がかかってしまいQM9ぐらのデータ数(10万以上)となるとPCのスペックにもよります…

Pythonを活用した機械学習用データ作成 その1(分子体積1)

機械学習を活用した材料開発が活発になってきています。機械学習には元になるデータセットが必要ですが、実験データ数には限界もあることから、計算機シュミレーションを活用したデータセットも作成されています。その中でもQMデータセットは数多くの機械学…

屈折率自動算出アプリ(CustumTkinter) その5

前回までに屈折率の自動計算のアプリのコード、利用画面の説明などについて紹介してきました。作成したコードをGitHubに公開していますので、MITライセンスのもとご自由に利用いただければと思います。 github.com ご利用にあたって、コメント、感想などがあ…

屈折率自動算出アプリ(CustumTkinter) その4

前回から引き続き屈折率自動算出アプリの紹介です。今回はアプリの利用方法について簡単に紹介したいと思います。 以下はこのシリーズの最初の回にも紹介したアプリの起動画面になります。 アプリの立ち上げ画面 画面構成ですが、ファイルの選択、計算方法の…

屈折率自動算出アプリ(CustumTkinter) その3

前回から引き続き屈折率自動算出アプリの紹介です。 前回もコメントさせていただきましたが、基本的なコードは以前に紹介した分子軌道情報(HOMO/LUMO)の自動算出アプリと同じです。 今回はCustumTkinterのパートの紹介です。 CustumTkinterですが、tkinter…

屈折率自動算出アプリ(CustumTkinter) その2

前回から引き続き屈折率自動算出アプリの紹介です。 具体的なコードですが、基本的なところは以前に紹介した分子軌道情報(HOMO/LUMO)の自動算出アプリと同じです。 最初にライブラリーのインポートと各種関数の設定を行っています。 屈折率はローレンツ・ロ…

屈折率自動算出アプリ(CustumTkinter) その1

データサイエンスの活用が進むにつれて、機械学習用のデータの入手、作成の重要性が増してきているように思います。最近では学習用データとして、実験データだけでなく計算機シミュレーションの活用が進められてきています。このような背景から、先の記事ま…

分子軌道情報(HOMO/LUMO)自動算出アプリ(CustumTkinter) その8

前回までに分子軌道情報の自動計算のアプリのコード、利用画面の説明などについて紹介してきました。作成したコードをGitHubに公開していますので、MITライセンスのもとご自由に利用いただければと思います。github.com ご利用にあたって、コメント、感想な…

分子軌道情報(HOMO/LUMO)自動算出アプリ(CustumTkinter) その7

これまでのシリーズでは軌道情報の自動計算アプリのコードの紹介をしてきました。今回はアプリの利用方法について簡単に紹介したいと思います。 以下はこのシリーズの最初の回にも紹介したアプリの起動画面になります。 分子軌道情報自動算出アプリ 起動画面…

分子軌道情報(HOMO/LUMO)自動算出アプリ(CustumTkinter) その6

前回に引き続きCustumTkinterを利用した軌道情報の自動計算アプリの紹介です。 今回もCustumTkinter関連のコードの設定コードの紹介の続きです。 計算手法のoption設定の表示ですが、数値入力がメインですのてtextBoxのウィジェットを使用しています。このウ…

分子軌道情報(HOMO/LUMO)自動算出アプリ(CustumTkinter) その5

前回に引き続きCustumTkinterを利用した軌道情報の自動計算アプリの紹介です。 今回はCustumTkinter関連のコードの設定コードの紹介です。CustumTkinterですが、tkinterと比べてある程度デザイン性に優れた画面を作成することが可能です。画面のモードの設定…

分子軌道情報(HOMO/LUMO)自動算出アプリ(CustumTkinter) その4

前回に引き続きCustumTkinterを利用した軌道情報の自動計算アプリの紹介です。 今回は計算実行用の処理関数の設定コードの紹介です。 始めに入力内容から化合物の情報(charge:電荷, multi:スピン多重度)、表示軌道数(orb)を読み込んでいます。また計算す…

分子軌道情報(HOMO/LUMO)自動算出アプリ(CustumTkinter) その3

前回に引き続きCustumTkinterを利用した軌道情報の自動計算アプリの紹介です。 今回は量子化学計算用の処理関数の設定コードの紹介です。構造最適化、振動計算、分子軌道の処理関数を作成しています。 まずは構造最適化(Geom_Opt)です。CustumTkinter(コー…

分子軌道情報(HOMO/LUMO)自動算出アプリ(CustumTkinter) その2

前回に引き続きCustumTkinterを利用した軌道情報の自動計算アプリの紹介です。 今回は処理関数の設定コードの紹介です。 # Smiles file select by filedialog def data_import(self): type=[('smi file','*.smi'), ('text file', '*.txt')] file=filedialog.…

分子軌道情報(HOMO/LUMO)自動算出アプリ(CustumTkinter) その1

データサイエンスの活用が進むにつれて、機械学習用のデータの入手、作成の重要性が増してきているように思います。最近では学習用データとして、実験データだけでなく計算機シミュレーションの活用が進められてきています。計算データは実測データよりも比…

化学構造データ変換‐Tips その3(組成式、分子量データ)

化学構造データ変換-Tips その3になります。 今回はsmiles形式で読み込んだデータからの化学組成式、分子量データの取り出しです。 利用データですが今回もその1の事例で使用したMolecular_Netでて提供されている水和の自由エネルギーデータ(SAMPL_MOL)の…

化学構造データ変換-Tips その2(sdfファイルの読み込み)

化学構造データ変換-Tips その2になります。 今回はsdfファイルの読み込みです。sdfファイルは、化学構造や物性データなどを記録するためのファイル形式のひとつです。 多くの化合物の化学構造とその物性データをひとつのファイルとして保存できるため、纏…

化学構造データ変換-Tips その1(canonical SMILES への変換)

化学構造のデータセットを扱う場合、ファイル形式、データ変換など細々と処理を行う場面によく遭遇します。 これらの事例について、自分自身の備忘録もかねて、Tipsとして記事を残しておきたいと思います。 過去の皆さんの事例を参考にしているので、特段目…

機械学習による(中古)不動産価格の予測 その10 Catboost でのモデル作成

前回までの記事でlightGBMを用いた予測モデル作成について紹介してきました。今回は別の勾配Boosting手法として「Catboost」で予測モデル作成を検討した事例について紹介します。「Catboost」は2017年に登場したアンサンブル学習法でYandex社から発表された…

機械学習による(中古)不動産価格の予測 その9 カテゴリー変数のダミー変数化

前回までの記事で新たに建物構造、接道、道路の種類等のパラメーターを追加したモデルの作成について紹介させていただきました。前回のモデルでは上記パラメータを何らか参考指標をもとに、数値化を行っていたのですが、今回は上記のカテゴリー変数をダミー…

機械学習による(中古)不動産価格の予測 その8 パラメーター追加(建物構造、接道、道路種類)モデル作成

前回までの記事で、説明変数としていくつかのパラメータの追加のコードを紹介させていただきました。今回は追加したパラーメータを使ってで改めてモデル作成を検討した結果について紹介します。コードは以前の「機械学習による(中古)不動産価格の予測 その…

機械学習による(中古)不動産価格の予測 その7 パラメーター追加(建物構造、接道、道路種類)

前回の記事で不動産価格の予測アプリの紹介させていただきました。ある程度の精度で予測はできるのですが、もう少し精度をあげられないかと思い、得られた情報から説明変数としてのパラメーターの追加の検討を行ってみました。 以下は一連の全体のコードです…

機械学習による(中古)不動産価格の予測 その7(tkinter アプリ)

先日紹介させて頂いた不動産価格の予測のtkinter アプリですが、一連のコードをGithubにアップしました。 https://github.com/winchemwin/house_price よろしければご参照ください。

機械学習による(中古)不動産価格の予測 その6(tkinter アプリ)

前回までの記事で中古不動産価格予測の回帰モデル作成について紹介してきました。幸いlightGBMでそれなりのモデルが作成できましたので、このモデルを用いた不動産価格の予測アプリをtkinterで作成してみました。 コード1 ライブラリーの読み込み まずは必…

機械学習による(中古)不動産価格の予測 その5

前回の記事で、中古不動産価格の予測モデルとして、lightGBMの利用とそのハイパーパラメーター最適化の事例について紹介しました。モデルとして比較的良い評価が得られてきていましたので、得られたモデルを用いて価格予測のコードを作成することにしました…

機械学習による(中古)不動産価格の予測 その4

前回までの記事で中古不動産価格の予測モデルの作成として、scikit-learnでの回帰モデル作成(Ababoost法)について紹介してきました。ただ、ハイパーパラメータの最適化も行いましたが回帰モデルとしてはあまり良い結果が得られてきていませんでした。 そこ…

機械学習による(中古)不動産価格の予測 その3

前回の記事で中古不動産価格の予測モデル作成について、scikit-learnでの回帰モデル作成について、紹介しました。あまり良い結果はえられなかったのですが、今回はAbaboost法でのハイパーパラメータの最適化について紹介したいと思います。 ハイパーパラメー…