4.05.2022

Population diversity 解析記録

やったこと

STRUCTURE, fastSTRUCTURE の勉強、使い方、example dataset での解析、本番の解析。結果の図示、一筋縄ではいかず、Rとエクセルを駆使しないといけないようだ。

STRUCTURE

4/1からパソコンが働きづめ。ローカルでしか動かないプログラム大変だなーー。よくクラッシュせずに働いてくれている。感謝感激。速いパソコンにしてほんとーーーに良かった。一度もシャットダウンしていないのでこれが終わったらしてあげよう。

fastSTRUCTRUE

ローカルではなくスパコン上で働いてくれるプログラムもあるのだが、速いのでやや精度に難あり、妥協点である。しかもモデルが複雑になると途端に遅くなる。K=4あたりまでは難なくいくのに、K=5以上になると全然終わらない。制限時間70時間として走らせてみると、1つのモデルを収束させるのに10時間かかった…。数学の、セールスマンの最短距離の問題に似ている。要素が多くなると、指数関数的に可能性が増え、計算量がけた外れになっていく、あれ。

数学とか今読んだら面白いのかもしれない。4/14の発表が終わったら、図書館で借りてみよう。

しかもこのモデル自体が私のサンプルに最適なものではないのでなんかどこまでそれを解釈するかなー

それに加え、コントロール群たちが上手くクラスターになっていないのが気になる…。ひょっとして我々は、ないものを頑張って見つけようとしているのではないだろうか??

1-2日かけていろいろ試して、「うん、この方法はあまりよくないな★」という結論が出るなんて日常茶飯事!

暗中模索の解析である。

ゴールがよくわからんので、exploratory にならざるを得ない。となると一から勉強して、この手法でいいのか…これは…なんてやっているとあっという間に時間が経つ。

博士課程の研究テーマにはexploratory 型のテーマを選んではいけない、というアドバイスは理にかなっている。道筋がはっきりしていない上、やったけど何も見つからなかったという結果がありうるからだ。何も見つからなかった、というのはさすがに、博士論文としては出しにくい。時期がきっちり決まっていて道筋がはっきりしている、仮説検証型に限る。

時差が問題だよなーー 学会も出にくいし。海外相手にフリーランスしている人たちはどうしているんだろう。調べてみよう。


No comments:

Post a Comment