2021年オープンキャンパス(青木・伊藤(康)研究室)
バイオインフォマティクス

はじめに

本研究室では,主に画像処理の研究をしていますが,画像処理以外の研究も行っています.その1つがバイオインフォマティクスの研究です.バイオインフォマティクスとは,生命科学と情報科学の融合分野です.ゲノム解析などが有名です.その中に,アプタマーと呼ばれる人工核酸を設計する研究があります.アプタマーは,特定のタンパク質に結合する塩基配列であり,その特性を利用してバイオ医薬品や分子センシングなどに応用されます.ここでは,膨大な核酸配列の中からアプタマーを探し出す研究について説明します.

アプタマー

アプタマーとは,人工的に作成された核酸塩基配列であり,特定のタンパク質に結合するように設計されます.例えば,アレルギー物質に反応するアプタマーがあれば,食べる前にアレルギー物質が含まれているかを確認することができます(蛍光タンパクを利用して箸先を光らせることが考えられています).その他にもストレスチェックやウイルスの計測などへの応用が検討されています.すごく便利そうなアプタマーですが,見つけ出すには,なかなかの労力が必要となります.

HT-SELEXによるアプタマーの選別

特定の標的分子に結合する塩基配列は未知であるため,大量の核酸の中から化学実験により見つけ出すしかありません.一般的にはSystematic Evolution of Ligands by EXponential enrichment (SELEX) と呼ばれる方法が用いられています.最近では,次世代シーケンシング (Next-Generation Sequencing:NGS) と組み合わせた HT-SELEXが用いられています.図1は,HT-SELEXの手順を図示したものです.HT-SELEXの6ステップは以下の通りです.

  1. ランダムに初期化された核酸分子からなる初期ライブラリの合成する.
  2. 標的分子を混ぜて核酸分子と結合させる
  3. 結合しなかった核酸分子を洗浄し,結合した核酸分子のみを残す.
  4. 結合した核酸分子から標的分子を溶出する.
  5. ポリメラーゼ連鎖反応 (Polymerase Chain Reaction: PCR) により溶出された核酸分子を増幅させる.
  6. 次世代シーケンサにより配列データを読み取る.
2~5を1ラウンドとして,8ラウンド程度繰り返すことによってアプタマーを選別することができます.ただし,1ラウンドに約1日ほどの時間がかかるだけではなく,$10^6\sim 10^7$個のシーケンスデータからアプタマーを見つけ出す必要があります.

traits
図 1:HT-SELEXによるアプタマーの選別

配列データのクラスタリング

HT-SELEXで得られた大量のシーケンスデータからアプタマーを見つけるためには,全データに対して実験的に評価する必要があります.費用と時間の面から非現実的です.そこで,標的分子との親和性が高い配列を計算機にて見つけ出すことができれば,費用と時間を大幅に節約することができます.そこで,本研究室では,アプタマーの選別を支援するためのクラスタリング手法を提案しています.クラスタリングとは,特徴が似ているものをグループとしてまとめるような操作です.私たちが提案している Fast String-Based Clustering (FSBC) では,統計的なスコアを利用することで高速かつ高精度に大量のシーケンスデータをクラスタに分けることができます.以前は膨大な時間がかかっていましたが,FSBCでは1分程度でアプタマーの候補を見つけることができます.詳細は,文献 [1] を参照してください.

まとめ

簡単ではありますが,本研究室で取り組んでいるバイオインフォマティクスの研究について紹介しました.まだはじめたばかりの新しいテーマではありますが,NECソリューションイノベータ株式会社バイオラボと共同で,アプタマー候補を高速に見つけ出すクラスタリング手法やアプタマー配列の小型化手法など,アプタマーの実用化を推進するための手法に関する研究を進めています.

NECソリューションイノベータで進めているアプタマーの応用例について紹介します.新型コロナウイルスの感染拡大が世界中で進んでいます.その中で,新型コロナウイルスにくっつくアプタマーの開発に成功したそうです.今後の実用化が待たれますが,このアプタマーを使うことで,空気中の新型コロナウイルスを検知するようなセンサを実現することができます.早く実用化されるといいですね.
新型コロナウイルス(SARS-CoV-2)と結合する人工DNAアプタマーの開発に成功(NECソリューションイノベータ・プレスリリース・2021年5月6日)

参考文献

  1. FSBC: Fast String-Based Clustering for HT-SELEX Data