OpenAIはAIモデルのトレーニング用データセットを生成するパートナーを募集している

OpenAIはAIモデルのトレーニング用データセットを生成するパートナーを募集している

IT Homeは11月10日、OpenAIがAIモデルのトレーニング用にパブリック/プライベートデータセットを生成するために組織と協力すると発表したと報じた。このデータパートナーシップの目的は、「より多くの組織がAIの未来を導くのに貢献できるようにする」ことと、「より有用なモデルから利益を得る」ことにある。

IT Homeはブログから、OpenAIが「最終的にAIをより安全にし、全人類に利益をもたらすためには、AIモデルがあらゆるトピック、業界、文化、言語を深く理解できるようになることを期待しており、そのためには可能な限り幅広いトレーニングデータセットが必要である」と述べたことを知った。

OpenAIは、データ・パートナーシップ・プログラムの一環として、「人間社会を反映した」、現在はオンラインで簡単にアクセスできない「大規模な」データセットを収集すると述べた。同社は画像、音声、動画など複数のモダリティにわたる取り組みを計画しているが、特にさまざまな言語、トピック、形式にわたる「人間の意図を表現する」(長文の文章や会話など)データを求めている

OpenAIは、必要に応じて組織と協力し、光学式文字認識と自動音声認識ツールを組み合わせてトレーニングデータをデジタル化し、必要に応じて機密情報や個人情報を削除すると述べた。

OpenAI は、AI モデルのトレーニングに誰でも使用できる公開オープンソース データセットと、独自の AI モデルをトレーニングするためのプライベート データセットのセットの2 種類のデータセットを作成したいと考えています。

OpenAIによると、このプライベートセットは、データを非公開にしたいが、OpenAIのモデルに自分の分野をより深く理解してもらいたい組織向けだという。これまでOpenAIは、アイスランド政府やMiðeind ehfと協力してGPT-4のアイスランド語会話能力を向上させ、Free Law Projectと協力してモデルの法的文書理解能力を向上させてきた。

<<:  製造および自動化アプリケーション向けの人工知能技術の選び方

>>:  AIはイスラエルとパレスチナの紛争の偽画像を生成し、それが非常にリアルであるためメディアで引用されている

ブログ    

推薦する

Sitechiのスマートオペレーションプラットフォームは、スマートシティが4.0時代に入ることを支援します

現在、中国ではデジタル経済の波が高まっています。情報技術を都市計画や建設とどのように融合させ、都市情...

人工知能について - AIに関するあまり知られていない事実

人工知能(AI)は60年前の1956年の夏に誕生しました。今日の科学技術の発展により、人工知能は人間...

機械翻訳と人工知能が融合すると、信頼性は高まるでしょうか?

機械翻訳というと、多くの人が戸惑うでしょう。10年以上も前には、英語の文章をKingsoft Pow...

ビデオ分析以外に、AI と機械学習はどのようなメリットをもたらすのでしょうか?

人工知能 (AI) と機械学習 (ML) は物理セキュリティ市場に大きな影響を与え、ビデオ分析の精度...

AIの偏見を公平に防ぐ方法

人工知能 (AI) には、ビジネス運営に革命を起こす大きな可能性があります。実際、ある調査によると、...

ロボット工学が医療業界にもたらす変化

ロボット工学は医療分野で一般的になりつつあり、生物医学工学の分野における医療用ロボットへの資金提供が...

デジタルトランスフォーメーションにおけるAIビッグモデルの現状と役割を客観的に見る

「デジタル変革における AI ビッグモデルの役割は、『データ中心のビジネス変革の 3 つのパラダイム...

ダボにおけるタイムホイールアルゴリズムの応用

[[346568]] 1 スケジュールされたタスクNetty、Quartz、Kafka、Linux ...

ウクライナ、写真を通じて殺害されたロシア兵の家族を発見?顔認識が初めて軍事紛争で大規模に使用され、大きな論争を巻き起こしている

報道によると、ウクライナが使用している顔データベースは、米国に本社を置くテクノロジー企業の「Clea...

2021年の機械学習ライフサイクル

機械学習プロジェクトを実際に完了するにはどうすればよいでしょうか? 各ステップを支援するツールにはど...

面接に合格してNLPの扉を開くのに役立つNLPの簡単なガイド

弱い人工知能の時代が到来し、人々の日常生活はアルゴリズムが提供するサービスと切り離せないものとなって...

AIOps 初心者ガイド: 基本的な概念と機能

[[380114]] [51CTO.com クイック翻訳] 世界中の企業が日常業務のデジタル化を進め...

コレクション | データアナリストがよく使用する機械学習アルゴリズム 10 個!

機械学習の分野では、「世の中にただ飯はない」という格言があります。簡単に言えば、あらゆる問題に対して...

中国は2022年に耐量子暗号アルゴリズムを開発し、2025年に実装予定

[[248782]]量子コンピュータが実用化されるまでにはしばらく時間がかかるだろうが、国際的な暗号...

コンピュータマスターのジレンマ!試験に合格するのは難しく、仕事を見つけるのも難しい

3年前、ディープラーニングを専攻し、2019年度に入学したばかりのコンピューターマスターが知乎に質問...