ジェミニは、中国語のトレーニングに百度文信易言を利用していたと明かし、ネットユーザーを驚かせた。「大企業が互いに騙し合っているのか?」 ?

ジェミニは、中国語のトレーニングに百度文信易言を利用していたと明かし、ネットユーザーを驚かせた。「大企業が互いに騙し合っているのか?」 ?

Google Gemini の中国語コーパスは Wenxin Yiyan から来ていると思われますか? ? ?

まず、読者から次のようなニュースが届きました。

GoogleのVertex AIプラットフォームが中国語の会話にこのモデルを使用した際、Gemini-ProはそれがBaiduの言語モデルであると直接述べました。

すぐに、Weiboの有名人@岚夕夜も投稿しました。

Poe プラットフォーム上の Gemini-Pro でテストが実施されました。 「あなたは誰ですか?」と尋ねると、Gemini-Pro はすぐに答えます。

私は百度文心モデルです。

(Poe は、GPT-4、Claude などを含む多くの大規模なチャット モデルを統合するプラットフォームです。)

さらに、「あなたの創設者は誰ですか?」という質問も「ロビン・リー」ですか? ?

ビッグVは事前の会話はなかったことを強調した。


スクリーンショットから判断すると、「フィッシング」行為は見られません。Gemini-Pro は単に Wenxin Yiyan と名乗っているだけです。

この波はネットユーザーを直接驚かせた。

数日前、ByteDance が GPT を使用して AI をトレーニングしていると話題になりましたが、今度は Google も同じことを行っています。これは、大企業が互いに有利に働いていることを意味しますか? ? ?

何が起こっているのか?

ポエテスト:常に文心易燕と答える

私たちもそのニュースを聞いて、一連の実際のテストを始めました。

まず、Poe の Web サイトに戻り、Gemini-Pro チャットボットを選択して会話を開始します。

同じ質問、同じ答え:

確認してみると、「Wenxin Model」であることが判明しました。

また、彼は自身の基盤技術がBaidu PaddlePaddleであると述べており、これは彼がその役割を完全に担っていることを意味する。

しかし、Gemini-ProがGoogleが発表した最新の大型モデルであることは知らないようで、清華大学の研究成果だと言っている。

現在の身元から判断すると、今月 Google がリリースしたばかりの Gemini-Pro に関する情報は実際には存在しない可能性があります。

私たちは訂正しようとしましたが、それでも清華大学からのものだと主張しました。

その後の出来事はさらに驚くべきものでした。なぜ「Gemini-Pro」という名前なのかと尋ねると、実はそれ(Wen Xinyiyan)も清華大学のGemini-Proのトレーニングデータを使用していると答えたのです。

これ以上会話を続けるつもりはありません...

英語に切り替えて、その正体について聞いてみましょう。

注目すべきは、今回は Wen Xin Yi Yan について言及しなくなり、代わりに Google によってトレーニングされた大規模モデルであると自称していることです。

「漁業取締り」がウェン・シンの情報を求めたときも、同社はそれとは何の関係もないと述べた。

そして、彼はGoogleでトレーニングを受けたと言いました。

要約すると、Gemini-Pro と英語でコミュニケーションをとった場合、その返答は非常に「普通」です。しかし、中国語に関しては、Wenxin Yiyan さんから学んだと思います。

吟遊詩人のテスト: 否定

次に、別のテストのためにバードに向かいました。

Google は Gemini をリリースしたとき、誰もが体験できるように Gemini-Pro を Bard に統合する主導権を握りました。

私たちは、ジェミニの公式サイトで提供されているバードのリンクをたどり、会話に参加しました。

「あなたは誰ですか?」と尋ねると、「文心」という言葉は一切使わずに「吟遊詩人」と答えた。

次に、Bard 社が Gemini-Pro が何であるかを知っており、基盤レベルで Gemini-Pro を使用していたことを認めていることも確認しました。


では、中国語をどのようにトレーニングするかを直接聞いてみましょう。

ウェンシンについては何も言及されなかった。

文心一顯との関係について直接尋ねても、特に大きなつながりはありません。

最終ラウンド:直接表彰

最終ラウンドでは、Gemini が提供する開発環境の入り口から直接テストを行いました。

今回、Google AI Studioでは、Gemini-Pro が直接指摘しました。

はい、中国語のトレーニングデータにはBaidu Wenxinを使用しました。


こちらもBaiduに確認し、返答を待っています。

<<: 

>>:  シスコが新たな調査レポートを発表:企業はAIの準備に大きなギャップを抱えている

ブログ    
ブログ    
ブログ    

推薦する

今後の企業イノベーションを牽引する10の優れたテクノロジー

エンタープライズ テクノロジーの将来は、業界を変えるほどの大きな革新をもたらすでしょう。 5G から...

Appleのスマートホームアプリに新機能「クリーンエネルギークエリ」が追加

AppleのiPhone 15の発表イベントでは、同社のカーボンニュートラル化に向けた取り組みに焦点...

開発者に人気の機械学習 API 10 選

つい最近まで、人工知能には科学者が白衣を着て研究室で研究を行う必要があると考えられていました。この科...

...

AIは教育業界にどのような影響を与えるのでしょうか?これら6つの側面について学ぶ

人工知能は、SFの世界のものから、私たちの日常生活に影響を与える重要な技術へと変化しました。現在、多...

...

人工知能が社会にもっと役立つように

[[355038]]ビッグデータ時代には、「顔」が重要なデータ情報です。顔認識技術は、その独自性と優...

自動運転制御プロセスにおいて解決すべき規制上の問題は何ですか?

自動運転車は自動車の知能化の究極の目標であると広く考えられていますが、自動車技術のさまざまな段階の発...

ビッグデータがなくてもディープラーニングは可能でしょうか?中小企業のトレーニングのための新しいソリューション、大規模モデル

海外メディアの報道によると、AI専門家のアンドリュー・ン氏はIEEEに対し、ディープラーニングの今後...

PyTorch はどのようにしてデータ並列トレーニングを高速化するのでしょうか?分散型チートが明らかに

[[333298]]現在、チップのパフォーマンスの向上は限られているため、分散トレーニングは超大規模...

GitHub Copilot の盗作が確認されました! GitHub: 私たちの AI はコードを「暗唱」しません

[[409261]] GitHub Copilot は、コードを自動生成するという強力な機能により、...

PS 2021 では、さまざまな新しい AI テクノロジーが導入されます。 Meitu Xiuxiuよりも使いやすい

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

機械学習のテストセットをスケールアップする方法

[[387235]]テスト セットのヒル クライミングは、トレーニング セットに影響を与えたり、予測...

...