私たちの研究室では、ゲノム解析に続く技術の進歩に伴い、種々のポストゲノム実験により得られるようになった多様かつ膨大なデータ(インタラクトーム、トランスクリプトーム、メタボローム等)を統合し、生命システムとしての普遍性および多様性の理解を目指すバイオインフォマティクス研究を行っています。
深層学習をはじめとする機械学習と統計解析の手法を、バイオビッグデータ、医療ビッグデータに適用し、ナノからマクロにいたる様々な生命機能の計測とその情報処理技術、医用画像処理などの研究と教育に取り組んでいます。
キーワード:バイオインフォマティクス、深層学習、医用画像処理、センサー開発
バイオインフォマティクス
生物学実験から得られる生物の構成要素(代謝物質、タンパク質、遺伝子等)の相互作用のデータをもとに、膨大なデータの体系的な把握を目指し、DPClus (図1上)、BL-SOM (図1下) などの情報処理アルゴリズムを開発しています。
また、バイオ情報データベースの構築を行っています。我々の研究室で構築しているKNApSAcK Familyデータベースは5万種類を超えるさまざまな生物の代謝物質の情報を蓄積しており、メタボロミクス研究の分野で世界から高い評価を受けている二次代謝物データベースです。また、漢方薬やインドネシア生薬(Jamu)、アーユルヴェーダなどの伝統的な生薬におけるさまざまな植物の利用のされ方などの知識を蓄積し、公開しています。
遺伝子解析の分野では、次世代シーケンサー(NGS)による遺伝子の発現解析を用い、植物が様々な代謝産物を生産する仕組みについて研究しています。数千〜数万種の遺伝子の中から統計解析の手法を使って有用な遺伝子を探し出すことを目的としています。
図1。KNApSAcKデータベース(http://www.knapsackfamily.com)のホームページ。天然代謝物質の検索と、薬用、食用のさまざまなレシピなどの検索ができる多機能データベースになっています。
深層学習
がん組織などの病理組織画像、CT、PETなどの医用画像、さらには心電図などの診断データから、深層学習を用いて特徴抽出を行い、診断支援などのアプリケーションを開発しています。
また、分子グラフをもとにした深層学習モデルを用いて、分子構造式から薬剤としての生物活性や生化学合成における代謝経路の予測など、構造相関解析とバイオインフォマティクス、メディカルインフォマティクスを連携させた応用を研究しています。
医用画像処理・センサー開発
断層撮影(CT)法や陽電子断層撮影法(PET)などの医用画像計測機器で得られる画像データから、心臓の冠動脈や脳内の認識野ごとの領域の抽出や定量的な測定を自動的に支援するといった、診断の支援となる医用画像の処理手法を開発しています。
また、深部体温計、容量結合心電図計、レーダー心拍計など、非侵襲な装置を使って、長時間連続的に体温、心拍など生命徴候を計測するセンサーを開発し、それらを利用したウェアラブルなヘルスケアデバイスを開発しています。更に、これらのデバイスを用いた連続的な生理信号を解析し、概日リズム等のバイオリズム解析など時間生物学分析の研究も行っています。