OpenAI が ChatGPT にマルチモーダル入力機能を追加しました。ご存知ですか?

OpenAI が ChatGPT にマルチモーダル入力機能を追加しました。ご存知ですか?

OpenAIのCEO、サム・アルトマン氏は昨夜Twitterで、ChatGPTに音声と画像の機能が追加されたと発表した。つまり、ChatGPT は、見る、聞く、話すことをサポートします。

今回ChatGPTが発表した音声・画像機能は、より直感的な新しいタイプのインターフェースを提供し、ユーザーは音声会話をしたり、自分の言っていることをChatGPTに伝えたりできるようになると報告されています。

アップデートされた ChatGPT は音声入力と画像入力をサポートするため、ユーザーはロボットと簡単にコミュニケーションできるようになります。音声入力機能は iOS および Android プラットフォームでのみ利用可能で、画像入力機能はすべてのプラットフォームで利用可能になります。

使用例

新しい機能は今後 2 週間以内に Plus ユーザーに提供される予定です。

<<: 

>>:  ハーバード大学の研究によると、GPT-4は一部の企業従業員のパフォーマンスを40%向上させることができるという。

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

EU、生成AIツールの規制について暫定合意に達する:これまでで最も包括的な規則

12月9日、ワシントンポスト紙やエンガジェットなどの海外メディアの報道によると、世界各国がAIの急速...

...

ユーザーの旅行需要予測

1. 背景と課題1. 背景Fliggy アプリ、Alipay、Taobao では、航空券、鉄道チケッ...

自然言語処理 (NLP) 開発で注目に値するオープン ソース ツールにはどのようなものがありますか?

インテリジェント音声アシスタントとチャットボットは、現在人工知能のホットスポットであり、画期的な進歩...

AI 開発の世界では、自然言語処理を真に習得することはどれほど重要ですか?

人工知能開発の分野で最も重要な目標は、自然言語処理 (NLP) を真に習得したシステムを作成すること...

...

Adobe、フォトショップで加工された人間の顔を自動検出できるAIツールを開発

偽の動画や画像の拡散に対する懸念は世界中で高まっており、Adobe もその懸念を共有していると述べて...

音声認識のクロスドメインおよびクロス言語移行の難しさを少しずつ軽減するにはどうすればよいでしょうか?

編集者注: ディープラーニングの継続的な発展により、音声認識技術は大幅に向上し、人々の日常生活に多く...

...

...

...

AI アプリケーションをテストするにはどうすればいいですか?

著者:サンジャナ・タクル徐潔成編纂人工知能技術は世界中で前例のないスピードで発展しています。短期間で...

...

中国と米国の差を縮め、人工知能開発の主導権を徐々に握る

60年以上の発展を経て、人工知能は人々の仕事や日常生活に入り込み、影響を与えており、新たな一般技術と...