これは、名古屋大学GSC MIRAIプロジェクト・セカンドステージ「コンピューターでタンパク質の構造・機能を探る」のガイド用に作成した文書です。
私達の生命活動はDNAの”設計図”に基づいて合成されたタンパク質に支えられています。20種類のアミノ酸が紐状に結合したタンパク質はアミノ酸の配列に応じて固有の構造に折畳みます。タンパク質構造をアミノ酸配列から予測する問題は大変困難な課題として長らく知られたきました。そのため、タンパク質構造予測の理論的・技術的発展を目指し、タンパク質構造予測のコンテスト(CASP)が隔年で実施されてきました。 一方、生物の脳を模したニューラルネットワークモデルは人工知能(AI)の発展に大きく寄与し、さらに深層学習の技術は社会生活のあらゆる面に浸透しはじめています。その一例として、AlphaFoldプログラムが挙げられます。このプログラムはCASPコンテストにおいて既存の手法を圧倒する好成績をみせています。最新版のAlphaFold2プログラムは、名大スパコンでも利用可能で、GPUを活用することで高速に動作することが確認されています。 ただし、AlphaFold2も万能ではありません。たとえば、近年注目を集めている天然変性タンパク質(IDP)は特定の立体構造を持ちません。また、多量体タンパク質の会合体も、AlphaFold2にとってな困難な予測対象です。 この実習では、立体構造データベースに未登録のアミノ酸配列から立体構造をAlphaFold2を用いて予測し、実験で決定された構造にどれだけ近い予測ができるかどうかを試すことを目的とします。