マイクロソフトは、対話してマルチモーダルコンテンツを生成できる AI モデル CoDi をリリースしました。

マイクロソフトは、対話してマルチモーダルコンテンツを生成できる AI モデル CoDi をリリースしました。

マイクロソフトは 7 月 11 日にプレスリリースを発行し、Combinable Diffusion Model (CoDi) を発表しました。これは、マルチモーダル コンテンツを対話して生成するように設計された、構成可能な拡散に基づく独自の人工知能モデルです。

Microsoft は、従来の単一モダリティ AI モデルの制限に対処するために CoDi を設計しました。同期されたビデオとオーディオを例にとると、独立して生成された情報ストリームは、つなぎ合わせたときに不整合や位置合わせの問題が発生する可能性があります。

CoDi は、独自の構成可能な生成戦略を採用し、拡散プロセスで複数のモダリティを調整して、絡み合ったパターンを生成します。さらに重要なのは、CoDi が任意の入力パターンを処理し、任意のモダリティのコンテンツを生成できることです。

CoDi は、Microsoft Azure Cognitive Services Research チームとノースカロライナ大学チャペルヒル校の協力により開発されたもので、人工知能を使用して人間とコンピューターの相互作用を強化する Microsoft のプロジェクト i-Code の一部です。

IT Home は、CoDi プロジェクトの公式紹介リンクをここに添付しています。興味のあるユーザーは、詳細を読むことができます。

<<:  考えてみてください。連合学習は大規模な言語モデルをトレーニングできるのでしょうか?

>>:  米国政府が警告: ​​ChatGPT は重大なセキュリティリスクをもたらす

ブログ    
ブログ    

推薦する

コンピュータービジョンにおける次の大きな進歩はどこから生まれるのでしょうか?

翻訳者 | ブガッティレビュー | Chonglou 1950 年代のコンピューター ビジョンの最初...

...

C# でのジョセフ リング アルゴリズムの簡単な分析

C# アルゴリズムを勉強しているときに、C# ジョセフ リング アルゴリズムに出会いました。ジョセフ...

...

Pytorch チュートリアル: 初心者向けクイックガイド

Python は、オープンソースの ML ライブラリ Pytorch のおかげで、データ サイエンス...

15年以内に恐竜を繁殖させる、マスクは恐竜を​​月に送りたいのか?

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

2021年にITリーダーがAIと機械学習に期待すること

毎年末と翌年の初めに、IT 思想リーダーが翌年のテクノロジー、革新的なサービス、業界の進歩などの開発...

人工知能の大学が雨後の筍のように次々と誕生しています。そこでは何を教えるのでしょうか?どのように教えるか?

[[240090]] 2018年グローバル人工知能製品アプリケーション博覧会で、来場者がテーマポス...

2024年に誰もが備えるべき5つのテクノロジートレンド

機械知能、現実と仮想の境界線の曖昧化、そしてインターネットの継続的な進化は、私たちの生活に根本的な影...

...

...

空飛ぶ脳?ヒントン氏のツイートは白熱した議論を引き起こした。ニューラルネットワークは鳥が飛ぶための「羽」なのか?

[[407838]]ヒントン氏はツイッターでちょっとした議論を始めた。「ニューラルネットワークを設...

機械学習がオラクルのクラウドアプリケーション戦略の中核に

オラクルの会長兼最高技術責任者(CTO)ラリー・エリソンは本日、Oracle Fusion Clou...

誇張か革命か?産業メタバースの4つの大きなトレンド

産業用仮想世界は、製造業者がすでに進めているデジタル変革を補完できるでしょうか? メタバースについて...