昨年度卒業した研究室2期生温井太一さんの研究成果が、論文としてBioinformatics Advances誌に掲載されました。
論文タイトル:An R package for ensemble learning stacking(アンサンブル学習スタッキングのためのRパッケージ)
著者:Taichi Nukui & Akio Onogi(温井太一・小野木章雄)
リンク:https://doi.org/10.1093/bioadv/vbad139
(リンクからどなたでも論文を見ることができます)
アンサンブル学習は、複数の予測手法を組み合わせることでより正確で頑健な予測手法を作成する方法です。スタッキングはアンサンブル学習の一種で、複数の予測手法の予測値をさらに別の手法で学習し、最終的な予測を得る手法です。予測手法を積み重ねる(スタック)ことに名前の由来があります。アンサンブル学習は近年、ゲノムや転写産物などから生物の性質を予測するための手法として利用が広がっています。
本研究では、プログラミング言語Rを用いて、このスタッキングを簡便に実行するためのパッケージ(ツールボックスのようなもの)「stacking」を開発しました。このパッケージによりわずか数行のプログラミングでスタッキングを試すことができます。パッケージは誰でも入手可能です(https://cran.r-project.org/web/packages/stacking/index.html)。温井さんは研究室に入ってからRを勉強し、卒業研究として開発を行いました。
生命データ科学研究室ではデータ解析を通じて様々な知見を得ようとしていますが、このように解析に必要なツールを作成することも行っています。今後も生物学や農学に有用な様々なツールを開発していきたいと思います。
小野木