マイクロソフトは 7 月 11 日にプレスリリースを発行し、Combinable Diffusion Model (CoDi) を発表しました。これは、マルチモーダル コンテンツを対話して生成するように設計された、構成可能な拡散に基づく独自の人工知能モデルです。 Microsoft は、従来の単一モダリティ AI モデルの制限に対処するために CoDi を設計しました。同期されたビデオとオーディオを例にとると、独立して生成された情報ストリームは、つなぎ合わせたときに不整合や位置合わせの問題が発生する可能性があります。 CoDi は、独自の構成可能な生成戦略を採用し、拡散プロセスで複数のモダリティを調整して、絡み合ったパターンを生成します。さらに重要なのは、CoDi が任意の入力パターンを処理し、任意のモダリティのコンテンツを生成できることです。 CoDi は、Microsoft Azure Cognitive Services Research チームとノースカロライナ大学チャペルヒル校の協力により開発されたもので、人工知能を使用して人間とコンピューターの相互作用を強化する Microsoft のプロジェクト i-Code の一部です。 IT Home は、CoDi プロジェクトの公式紹介リンクをここに添付しています。興味のあるユーザーは、詳細を読むことができます。 |
<<: 考えてみてください。連合学習は大規模な言語モデルをトレーニングできるのでしょうか?
>>: 米国政府が警告: ChatGPT は重大なセキュリティリスクをもたらす
翻訳者 | ブガッティレビュー | Chonglou 1950 年代のコンピューター ビジョンの最初...
C# アルゴリズムを勉強しているときに、C# ジョセフ リング アルゴリズムに出会いました。ジョセフ...
Python は、オープンソースの ML ライブラリ Pytorch のおかげで、データ サイエンス...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
毎年末と翌年の初めに、IT 思想リーダーが翌年のテクノロジー、革新的なサービス、業界の進歩などの開発...
[[240090]] 2018年グローバル人工知能製品アプリケーション博覧会で、来場者がテーマポス...
機械知能、現実と仮想の境界線の曖昧化、そしてインターネットの継続的な進化は、私たちの生活に根本的な影...
[[407838]]ヒントン氏はツイッターでちょっとした議論を始めた。「ニューラルネットワークを設...
オラクルの会長兼最高技術責任者(CTO)ラリー・エリソンは本日、Oracle Fusion Clou...
産業用仮想世界は、製造業者がすでに進めているデジタル変革を補完できるでしょうか? メタバースについて...