育種学会第116回講演会を聞きに行った。

で、Association analysisあるいはAssociation mappingに関する発表があったのだけれど(ひょっとしたら、このblogをご覧になっているあなたの発表かもしれません)、どうも”煮込み方”が足りないという印象。

とある発表では、日本稲112品種、10栽培環境、ゲノム上の観測ポイント2132点。解析ソフトは、集団構造解析にはStructure Ver. 2.2を、血縁度はSPAGeDi Ver. 1.2を、Genome-wide association study(GWAS)にはTASSEL Ver. 2.1を使用した、とある。

研究の目的は、日本の水稲品種にGWASを適用できうるか?という命題に対する条件検討で、目標形質は”出穂期”。

以下、私の感想。

  • こういう場合、栽培環境 x 遺伝子型の相互作用をみるので、出穂期よりは"到穂日数"を指標にした方が良かろう。
  • イネの登穂日数に関わる遺伝子と言えば、構造が決められていて、作用力の大きい感光性遺伝子、Hd1, Hd2, Hd3a, Hd5, Hd6がすぐに思いつく。この辺のハプロタイプと登穂日数のassociation analysisもやっておいてベンチマークにしておかないと、GWASの検出力や検出精度を議論するのは難しいのではないか(AICのような情報量基準を採用してモデルの妥当性を議論するにはGWAS以外の方法によるassociation analysisとの比較が要るだろう)。
  • TASSELでは家系や集団構造を考慮した混合線形モデルを採用できる・・・が論文をな斜め読みした範囲では、分析の際に家系(kinship)に関する分散は、外部から与えるケースと、マーカー情報から計算するケースの2通りが用意されているので、どちらを採用したのかを明らかにしておいた方がよいだろう。
  • TASSELではマーカー間の相加効果や優性効果は見ない。・・・出穂性の場合をモデルケースにすると、いくつかのHd遺伝子のハプロタイプで相加・優性効果を組み込んだGLMの方がモデルのフィットネスが高くなるかも?
  • いえね、なんでこんなことを気にするかというと、新しいモデルを提唱する場合、従来の方法と比べて、第一種過誤、第二種過誤がどのくらい起こり易いかが重要だと思うから。スクリーニング目的で、第二種過誤は大目に見ても良い場合もあるが、新しいQTLを見つけて遺伝子単離をしようという場合、第一種過誤で生じた擬陽性を信じて研究資源を注ぎ込むとえらいことになってしまう。新しいモデルがものの役に立つかどうかを判断するのは、モデルを採用する側が決めること。しかし、そのモデルを採用した場合どの程度のリスクがあるのかを、あらかじめ明らかにするところまでは、モデルの適否を検討する側の責任だと思う。

ということで、Hd遺伝子のハプロタイプで登穂日数のGLMをやった場合と比べて、GAWSの有効性と統計的過誤のリスクはどうなのよ?というのが私の疑問。

# 私がこの研究論文の査読をすることは無いと思うけど、もし来たら上記の理由で追加データを求めることは必定 ・・・。

こういうアプローチって面白いんですけどね。変異体を作ると死んでしまうような”あって当たり前”の形質−作物としてはむしろ重要な形質−を分子生物学の射程に捉えるにはQTLの検出が最も有効な方法なのだから。

QTLもいずれは、時間との関わりでどんどん変化する表現型を、”表現型の変化速度”に微分して解析できるようにならないといけないのだろうな。作物学的には、栄養生長と生殖生長に分けて、登穂日数=幼穂形成までの日数+幼穂分化後の日数とする見方は当たり前だ(観測の手間が大変だけど)。いずれは、時々のサンプリング時点の”表現型の変化速度”は、サンプリングの前日までの生育に影響されるという意味で、前日の日照や気温、生育状態を考慮したベイズモデルへと進化していくのかもしれない。

人気blogランキングへ←このへん、クリックしていただけますと、私も若干元気になるかもしれません。