【植物生命・卒研紹介シリーズ】No. 7 生命データ科学研究室

 寒い日が続いていますが、 植物生命科学科の各研究室では卒業研究が佳境を迎え、4回生が熱い日々を過ごしています。学科の卒業研究発表会まで残り二ヶ月、各研究室の卒業研究の様子をリレー形式でお伝えしようと思います。植物生命の各研究室ではどんな研究をしているのでしょうか?


データから生命や農業の新たな知識を得る

生命データ科学研究室(小野木)では、生命や農業に関係するデータの解析を通して新たな知識を得ることを目的としています。そのためゼミはデータ解析の手法や技術を身に付けることに主眼が置かれます。

3年生のゼミの様子です。この回はベイズ推定という統計学の一つの枠組みについて、パソコンを使った演習を交えて説明を受けています(難しかったようですが・・・)。


研究室で主に使うのはRというプログラミング言語です。無料で使用することができ、様々なパッケージ(目的に合わせたツールキットのようなもの)が用意されているので、生物学の分野でよく使われています。Rは以下から入手可能です。


ゼミ生は週一回のゼミや課題をこなしつつ、少しずつRのプログラミングを習得していきます。

ではどのような研究をしているか、具体例として4年生の寺本さんの卒業研究を紹介します。この研究ではダイズの品種改良で得られた過去55年分のデータを用いて、DVR(developmental rate)モデルという作物の開花期を予測するための数理モデルを最適化しました。DVRモデルは以下のような式をしています。
この式のAは気温感応性、Bは日長感応性、ThはDVR が半分に減る温度、Pcは生育が進む限界日長を表すパラメータです。ここにその日の平均気温(T)と日長(P)を入力すると、その日のDVRが出力されます。このDVRを出芽から累積していき、閾値Gを超えると開花するとします。一度これら5つのパラメータ(ABThPcG)を実際のデータに合わせて最適化すると、任意の気温・日長のもとで(つまり任意の環境での)開花日が予測できます。

このパラメータの最適化はコンピュータで行うのですが難しいことが知られています。そこで最適化の手法としてNelder-Mead法・群粒子最適化法・遺伝的アリゴリズムを比較し、どの手法が最もよいか調べました。結果、群粒子最適化法による最適化が僅かな差であるものの、最も良い開花日予測を与えることがわかりました。
Rスクリプトの例

またパラメータの最適化は品種ごとに行うため、最適化されたパラメータ値は品種の特性も表します。日本の多数の品種について最適化をしたところ、品種の適応地域によりパラメータ値に傾向があることもわかりました。以上の結果は作物学的に興味深く、現在寺本さんとともに投稿論文を準備しているところです。

(小野木)