人工知能アルゴリズムが構造生物学の難問を解決

新しい人工知能アルゴリズムは、RNA 分子の正しい 3 次元構造を間違ったものから選び出すことができます。 RNA の折り畳み構造をコンピューターで予測することは、多くの場合重要ですが、既知の構造が非常に少ないため困難です。

生体分子の三次元構造を決定することは、現代の生物学および医学の発見における最も困難な問題の 1 つです。企業や研究機関は分子の構造を決定するために何百万ドルも費やすことがよくありますが、そのような努力でさえ失敗に終わることがよくあります。

スタンフォード大学の博士課程の学生、ステファン・アイスマン氏とラファエル・タウンゼンド氏は、コンピューターサイエンスの准教授、ロン・ドロール氏の指導の下、巧妙な新しい機械学習技術を用いて、コンピューターを使って正確な構造を予測することでこの課題を克服する方法を開発した。

特に注目すべきは、彼らの方法が、わずか数個の既知の構造から学習したにもかかわらず成功し、実験的に決定するのが難しい分子にも適用できることである。

研究成果は、2021年8月27日にサイエンス誌に、2020年12月にプロテインズ誌にそれぞれ掲載された。論文ではRNA分子と多タンパク質複合体が詳細に紹介されている。このサイエンス論文は、スタンフォード大学の生化学の准教授であるリジュ・ダス氏と共同で執筆された。

「構造生物学は分子の形状を研究する学問であり、構造が機能を決定するという信条がある」とタウンゼンド氏は語った。

研究者らは分子の正確な構造を予測できるアルゴリズムを設計した。科学者はこれを使ってさまざまな分子の働きを説明できる。このアプローチの応用範囲は、基礎生物学研究から実用的な医薬品設計まで多岐にわたります。

タンパク質構造のさまざまなレベル。コイル状に折り畳まれているため、タンパク質の構造は空間的に非常に複雑です。

「タンパク質は、さまざまな機能を実行する分子機械です。これらの機能を実行するために、タンパク質はしばしば互いに結合します」とアイスマン氏は言います。「一対のタンパク質が病気と関連していることがわかっていて、それが三次元でどのように結合するかがわかっていれば、非常に特異的な標的薬でそれらの相互作用に影響を与えることができます。」

アイスマン氏とタウンゼント氏は、ダス研究室のスタンフォード大学ポスドク研究員アンドリュー・ワトキンス氏とサイエンス誌の論文を共同執筆し、また、元スタンフォード大学博士課程の学生ナサニエル・トーマス氏とタンパク質誌の論文を共同執筆した。

設計アルゴリズム

研究者たちは、構造予測をより正確にするために何が必要かを指定するのではなく、アルゴリズムが自らこれらの分子特性を発見できるようにした。彼らがそうしたのは、この知識を提供する従来の手法では、アルゴリズムが特定の特徴に偏ってしまい、他の有益な特徴を発見できなくなることがわかったためです。

「アルゴリズムで特徴を手動で選択することの問題点は、アルゴリズムが偏ってしまうことです。つまり、選択者が重要だと考えるものに偏ってしまうのです。研究をより包括的にするために必要な情報を見逃してしまう可能性があります」とアイスマン氏は言う。

「明確な指示がなくても、ネットワークは分子構造の形成に重要な基本概念を探すことを学習しました」とタウンゼンド氏は言う。「興味深いのは、アルゴリズムが明らかに重要だとわかっているものを拾い上げ、さらに聞いたことのない特性も発見したことです。」

タンパク質研究での成功の後、研究者たちは次にこのアルゴリズムを別の重要な生物学的分子のクラスである RNA に適用しました。彼らは、その分野で長年続いている競争から選ばれた一連の「RNAパズル」でアルゴリズムをテストした。いずれの場合も、このツールは他のすべてのパズルプレーヤーよりも優れたパフォーマンスを発揮し、アルゴリズム自体は RNA 構造専用に設計されたものではありませんでした。

幅広い用途

これまでのところ、この研究はタンパク質複合体とRNA分子で成功しており、研究者たちはそれが他のどこで使用できるかを楽しみにしている。

「機械学習における最近のブレークスルーのほとんどは、トレーニングに大量のデータを必要とします。私たちのアプローチは、トレーニングデータがほとんどなくても成功しています。これは、関連する方法が、データが不足している分野の未解決の問題を解決するのに役立つことを示しています」と、Proteins 論文の主任著者であり、Science 論文の共同主任著者である Dror 氏は述べています。

人工知能を使用して開発された新しい分子は、医薬品の研究開発に応用できます。

特に構造生物学においては、研究チームは、まだ科学的進歩の表面に触れたに過ぎないと述べている。「この基本的な技術を習得すると、理解がさらに深まり、さまざまな疑問を投げかけることができるようになります」とタウンゼンド氏は言う。「たとえば、こうした情報があれば、新しい分子や薬剤の設計を始めることができます。これは誰もが興味を持っている分野です。」

<<: DeepSpeechを使用してアプリ内で音声をテキストに変換する

>>: インタビュー必須：バックトラッキングアルゴリズムの詳細な説明