IT Homeは11月10日、OpenAIがAIモデルのトレーニング用にパブリック/プライベートデータセットを生成するために組織と協力すると発表したと報じた。このデータパートナーシップの目的は、「より多くの組織がAIの未来を導くのに貢献できるようにする」ことと、「より有用なモデルから利益を得る」ことにある。 IT Homeはブログから、OpenAIが「最終的にAIをより安全にし、全人類に利益をもたらすためには、AIモデルがあらゆるトピック、業界、文化、言語を深く理解できるようになることを期待しており、そのためには可能な限り幅広いトレーニングデータセットが必要である」と述べたことを知った。 OpenAIは、データ・パートナーシップ・プログラムの一環として、「人間社会を反映した」、現在はオンラインで簡単にアクセスできない「大規模な」データセットを収集すると述べた。同社は画像、音声、動画など複数のモダリティにわたる取り組みを計画しているが、特にさまざまな言語、トピック、形式にわたる「人間の意図を表現する」(長文の文章や会話など)データを求めている。 OpenAIは、必要に応じて組織と協力し、光学式文字認識と自動音声認識ツールを組み合わせてトレーニングデータをデジタル化し、必要に応じて機密情報や個人情報を削除すると述べた。 OpenAI は、AI モデルのトレーニングに誰でも使用できる公開オープンソース データセットと、独自の AI モデルをトレーニングするためのプライベート データセットのセットの2 種類のデータセットを作成したいと考えています。 OpenAIによると、このプライベートセットは、データを非公開にしたいが、OpenAIのモデルに自分の分野をより深く理解してもらいたい組織向けだという。これまでOpenAIは、アイスランド政府やMiðeind ehfと協力してGPT-4のアイスランド語会話能力を向上させ、Free Law Projectと協力してモデルの法的文書理解能力を向上させてきた。 |
<<: 製造および自動化アプリケーション向けの人工知能技術の選び方
>>: AIはイスラエルとパレスチナの紛争の偽画像を生成し、それが非常にリアルであるためメディアで引用されている
数枚のステッカーで交通標識の認識結果が「変わる」ことがあり、方向を変えると写真に写っている動物の種類...
健康診断のために病院に行くところを想像してください。診察室に入るとすぐに、看護師があなたの写真を撮り...
この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...
過去 10 年間で、強化学習 (RL) は機械学習で最も人気のある研究分野の 1 つになりました。R...
友人の輪の中で小さなボスがチキンスープを作っているのをよく見かけます。「すべての労働者の皆さん、仕事...
[[80451]]数日前、AppleのApp Storeの検索アルゴリズムが変わり始めたかもしれない...
仮想化技術はコンピューティング分野で幅広い用途があり、ハードウェア リソースの利用率を向上させ、メン...
[51CTO.com クイック翻訳]企業の業務効率と事業部門の競争力を向上させるための重要なツールと...
[[201444]]ニューラルネットワークのデバッグは、専門家にとっても困難な作業です。数百万のパラ...
仮想化テクノロジーは、物理ホストが複数の仮想コンピューティング環境を同時に実行できるように、コンピュ...
Raspberry Pi は、小さなおもちゃの車から産業用ロボットアームに至るまで、あらゆるものに...