人工知能アルゴリズムが構造生物学の難問を解決

人工知能アルゴリズムが構造生物学の難問を解決

新しい人工知能アルゴリズムは、RNA 分子の正しい 3 次元構造を間違ったものから選び出すことができます。 RNA の折り畳み構造をコンピューターで予測することは、多くの場合重要ですが、既知の構造が非常に少ないため困難です。

生体分子の三次元構造を決定することは、現代の生物学および医学の発見における最も困難な問題の 1 つです。企業や研究機関は分子の構造を決定するために何百万ドルも費やすことがよくありますが、そのような努力でさえ失敗に終わることがよくあります。

スタンフォード大学の博士課程の学生、ステファン・アイスマン氏とラファエル・タウンゼンド氏は、コンピューターサイエンスの准教授、ロン・ドロール氏の指導の下、巧妙な新しい機械学習技術を用いて、コンピューターを使って正確な構造を予測することでこの課題を克服する方法を開発した。

特に注目すべきは、彼らの方法が、わずか数個の既知の構造から学習したにもかかわらず成功し、実験的に決定するのが難しい分子にも適用できることである。

研究成果は、2021年8月27日にサイエンス誌に、2020年12月にプロテインズ誌にそれぞれ掲載された。論文ではRNA分子と多タンパク質複合体が詳細に紹介されている。このサイエンス論文は、スタンフォード大学の生化学の准教授であるリジュ・ダス氏と共同で執筆された。

「構造生物学は分子の形状を研究する学問であり、構造が機能を決定するという信条がある」とタウンゼンド氏は語った。

研究者らは分子の正確な構造を予測できるアルゴリズムを設計した。科学者はこれを使ってさまざまな分子の働きを説明できる。このアプローチの応用範囲は、基礎生物学研究から実用的な医薬品設計まで多岐にわたります。

タンパク質構造のさまざまなレベル。コイル状に折り畳まれているため、タンパク質の構造は空間的に非常に複雑です。

「タンパク質は、さまざまな機能を実行する分子機械です。これらの機能を実行するために、タンパク質はしばしば互いに結合します」とアイスマン氏は言います。 「一対のタンパク質が病気と関連していることがわかっていて、それが三次元でどのように結合するかがわかっていれば、非常に特異的な標的薬でそれらの相互作用に影響を与えることができます。」

アイスマン氏とタウンゼント氏は、ダス研​​究室のスタンフォード大学ポスドク研究員アンドリュー・ワトキンス氏とサイエンス誌の論文を共同執筆し、また、元スタンフォード大学博士課程の学生ナサニエル・トーマス氏とタンパク質誌の論文を共同執筆した。

設計アルゴリズム

研究者たちは、構造予測をより正確にするために何が必要かを指定するのではなく、アルゴリズムが自らこれらの分子特性を発見できるようにした。彼らがそうしたのは、この知識を提供する従来の手法では、アルゴリズムが特定の特徴に偏ってしまい、他の有益な特徴を発見できなくなることがわかったためです。

「アルゴリズムで特徴を手動で選択することの問題点は、アルゴリズムが偏ってしまうことです。つまり、選択者が重要だと考えるものに偏ってしまうのです。研究をより包括的にするために必要な情報を見逃してしまう可能性があります」とアイスマン氏は言う。

「明確な指示がなくても、ネットワークは分子構造の形成に重要な基本概念を探すことを学習しました」とタウンゼンド氏は言う。「興味深いのは、アルゴリズムが明らかに重要だとわかっているものを拾い上げ、さらに聞いたことのない特性も発見したことです。」

タンパク質研究での成功の後、研究者たちは次にこのアルゴリズムを別の重要な生物学的分子のクラスである RNA に適用しました。彼らは、その分野で長年続いている競争から選ばれた一連の「RNAパズル」でアルゴリズムをテストした。いずれの場合も、このツールは他のすべてのパズル プレーヤーよりも優れたパフォーマンスを発揮し、アルゴリズム自体は RNA 構造専用に設計されたものではありませんでした。

幅広い用途

これまでのところ、この研究はタンパク質複合体とRNA分子で成功しており、研究者たちはそれが他のどこで使用できるかを楽しみにしている。

「機械学習における最近のブレークスルーのほとんどは、トレーニングに大量のデータを必要とします。私たちのアプローチは、トレーニングデータがほとんどなくても成功しています。これは、関連する方法が、データが不足している分野の未解決の問題を解決するのに役立つことを示しています」と、Proteins 論文の主任著者であり、Science 論文の共同主任著者である Dror 氏は述べています。

人工知能を使用して開発された新しい分子は、医薬品の研究開発に応用できます。

特に構造生物学においては、研究チームは、まだ科学的進歩の表面に触れたに過ぎないと述べている。 「この基本的な技術を習得すると、理解がさらに深まり、さまざまな疑問を投げかけることができるようになります」とタウンゼンド氏は言う。「たとえば、こうした情報があれば、新しい分子や薬剤の設計を始めることができます。これは誰もが興味を持っている分野です。」


<<:  DeepSpeechを使用してアプリ内で音声をテキストに変換する

>>:  インタビュー必須:バックトラッキングアルゴリズムの詳細な説明

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

量子畳み込みネットワークにおける「不毛のプラトー」現象が解決され、新たな研究により量子AIの大きな問題が克服された

量子コンピュータの出現は、コンピュータ分野に多くの進歩をもたらしました。量子コンピュータ上で実行され...

中国情報通信研究院が2021年最初の「信頼できるAI成果」を発表、百度が5つの賞を受賞

[[416150]]グローバルな AI ガバナンスのコンセンサスを実装し、信頼できる AI テクノロ...

負荷分散アルゴリズムの分類の詳細な説明

負荷分散により、ネットワーク パフォーマンスとネットワーク動作環境を効果的に改善できます。では、負荷...

Google MITの最新の研究は、高品質のデータを入手することは難しくなく、大規模なモデルが最適な方法であることを証明しています。

高品質なデータの取得は、現在の大規模モデルのトレーニングにおける大きなボトルネックとなっています。数...

AIoTは単なる発言ではない

みなさんこんにちは。今日はAIoTについてお話します。 AIoT、つまり AI + IoT は、人工...

NLP: 車輪の再発明はしない

導入自然言語処理 (NLP) は困難な分野です。構造化されていないテキストから有用な結論を生成するこ...

マイクロソフト、医療病理学の症例を分析する LLaVA-Med AI モデルを発表

6月14日、マイクロソフトの研究者らは、主に生物医学研究に使用され、CTやX線画像に基づいて患者の病...

AIがエンタープライズデータカタログを救う方法

「データ カタログ」という概念は、実は新しいものではありません。メインフレームの時代から、企業はデー...

ソースディレクトリ内のファイルをプレフィックスに応じて異なるディレクトリに分散するためのアルゴリズム設計と C コードの実装

1. 要件の説明Linux システムのソース ディレクトリには、同じサフィックスを持つファイルがいく...

...

自動配送物流における人工知能の応用

[[406604]]コロナウイルスの流行を受けて、企業はサプライチェーンの複雑性と労働力不足の課題を...

ナレッジグラフとディープラーニングが「出会う」とき

著者: Xiao Yanghua、復旦大学コンピュータ科学技術学院准教授、博士課程指導教員、上海イン...

AIが観測性を高める方法

今の時代、過去を懐かしむのは当然ですが、私たちは、以前と同じ観測可能性を持つことは決してできないよう...

...