fantom_zona’s diary

Impact the world!!!

Epigenetic Landscapes Explain Partially Reprogrammed Cells and Identify Key Reprogramming Genes

軽い紹介

リプログラミングと連想記憶って似てるんじゃないということから、スピングラスの物理を使ってWaddington's landscapeを作ってみたという論文。

アレイのデータから発現量をバイナリ化して扱ってる。バイナリ化の根拠として、ヒストン修飾を調べていて、これが割と2値っぽいと言っている。

63個の細胞を1337個のTFで記憶してるとしてlandscapeの作成をした。

common myeloid progenitorからの分化の再現、ESCの安定性を再現してたりする。

ただし山中因子によるiPSCの再現はできなかったらしい。

また、リプログラミングとかの過程でよく分からない細胞群が出てきてしまうことが知られているんだが、それはスピングラスの理論を使うとかなりnaturalだよって言っている。類似度も計算できてる。

他には、その状態に寄与しているTFを選び出すことができるらしく、それらを使えばリプログラミングとかdirect conversionに使えるんじゃない?って言っている。

 

感想

バイナリ化っていうかなり大胆な過程を踏んでいても、ある程度既知の知識が再現できてしまうのは面白い。ただ山中因子が説明できなかったのは痛い。

リプログラミングの過程でできてしまうよく分からない細胞ってとこに関しては、論文内で言うところの"experimentalist"もある程度わかっていたことな気がする。アレイとってヒートマップで、ある程度わかる気がするから、この理論としてわかったことではないような気がする。自然に出てくるという点ではまあそうかって感じではあるが。

やはりこういう系では細胞状況への寄与率が高いTFが予測できたら、それを使って実際にdirect conversionとかの手法を作って欲しい感じはする。(firstは物理屋さんだからそれは多分ないけど。)

あと、モデルに出てくる定数が気になる。これは符号が大事であるということは分かるんだが、符号さえあっていればモデルとしては等価なんだろうか。スピングラスの物理がそこまで詳しくないから分からない。

あと、寄与率を計算する式が最小二乗法で出てくる正規方程式と(たぶん)同じになるんだけど、機械学習と連想記憶の関連はちょっと調べてみたい。

リプログラミングと連想記憶のアナロジーっていうのは新鮮だった。しかも話は割とシンプルだし、TFのcascadeとかの知識が全くなしにアレイデータさえあればここまで作れてしまうのは面白い。 Waddington's landscapeっていう誰もが知ってるテーマに挑んでいるのも好感が持てる。データが公開されて天才がすごいモデル作る!みたいな話っぽいくて好き。