昨年度卒業した研究室2期生の温井太一さんが日本育種学会第143回講演会(3/17~18@静岡大学)で口頭発表を行いました。
(残念ながら会場で本人の写真を撮り忘れたので、発表資料のタイトルという地味な画像になってしまいました・・・)。
内容はスタッキング(stacking)という機械学習の一種を行うためのツールキットを開発し、ダイズの成熟期予測に応用した、というものです。プログラミング言語は生物学でよく用いられるRを使用しました。スタッキングはアンサンブル学習という複数の予測手法を利用する学習方法の一種であり、データ解析のコンペティションでもよく用いられます。
作物の成熟期は収穫の時期や生育期間を左右する重要な性質であり、遺伝子や様々な環境要因の影響を受けます。そのため成熟期の予測は栽培管理や品種改良において重要ですが、難しいことでも知られています。今回、機械学習の一種であるスタッキングを用いることで、従来手法より高い正確さでダイズ成熟期の予測が可能であることを示すことができました。
機械学習には様々な予測手法があり、スタッキングに限らず多様な手法を試み、より正確な予測が可能なように研究を続けていきたいと思います。
生命データ科学研究室 小野木