fantom_zona’s diary

Impact the world!!!

化合物-タンパク質相互作用の予測器を動かしてみた

はじめに

この論文を読んでみました。githubにコードが落ちていたのでcolaboratory上で動かしてみました。

colabでの環境構築

rdkitを入れなくてはいけないのでやむなくminicondaを入れました。
conda-forgeから入れるとこのバグは生じませんでした。

!wget -c https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
!chmod +x Miniconda3-latest-Linux-x86_64.sh
!bash ./Miniconda3-latest-Linux-x86_64.sh -b -f -p /usr/local

conda install -c conda-forge rdkit pytorch scikit-learn

実行手順

あとはgithubに書いてある通りです。
wgetでフォルダを入れた後にCPI_prediction/codeまで降ります。ちなみに、colabはディレクトリの移動は%cdじゃなくてはいけないようですので注意してください。なぜかは知りません。

!mkdir cpi
%cd cpi
!wget -c https://github.com/masashitsubaki/CPI_prediction/archive/master.zip
!unzip master.zip
%cd CPI_prediction-master/code
!bash preprocess_data.sh
!bash run_training.sh

結果

githubに書いてある通りです。
参考までに、epoch50でAUC=0.9596、Precision=0.9240、Recalll=0.8827です。
100 epoch回し終わるまでに1時間くらいだったかな?

感想

すごい。chemblなどの非常に大きなデータセットに対しても有効なのかどうか気になるところです。元データの論文を次は読んでみたいと思います。