OpenAIはAIモデルのトレーニング用データセットを生成するパートナーを募集している

OpenAIはAIモデルのトレーニング用データセットを生成するパートナーを募集している

IT Homeは11月10日、OpenAIがAIモデルのトレーニング用にパブリック/プライベートデータセットを生成するために組織と協力すると発表したと報じた。このデータパートナーシップの目的は、「より多くの組織がAIの未来を導くのに貢献できるようにする」ことと、「より有用なモデルから利益を得る」ことにある。

IT Homeはブログから、OpenAIが「最終的にAIをより安全にし、全人類に利益をもたらすためには、AIモデルがあらゆるトピック、業界、文化、言語を深く理解できるようになることを期待しており、そのためには可能な限り幅広いトレーニングデータセットが必要である」と述べたことを知った。

OpenAIは、データ・パートナーシップ・プログラムの一環として、「人間社会を反映した」、現在はオンラインで簡単にアクセスできない「大規模な」データセットを収集すると述べた。同社は画像、音声、動画など複数のモダリティにわたる取り組みを計画しているが、特にさまざまな言語、トピック、形式にわたる「人間の意図を表現する」(長文の文章や会話など)データを求めている

OpenAIは、必要に応じて組織と協力し、光学式文字認識と自動音声認識ツールを組み合わせてトレーニングデータをデジタル化し、必要に応じて機密情報や個人情報を削除すると述べた。

OpenAI は、AI モデルのトレーニングに誰でも使用できる公開オープンソース データセットと、独自の AI モデルをトレーニングするためのプライベート データセットのセットの2 種類のデータセットを作成したいと考えています。

OpenAIによると、このプライベートセットは、データを非公開にしたいが、OpenAIのモデルに自分の分野をより深く理解してもらいたい組織向けだという。これまでOpenAIは、アイスランド政府やMiðeind ehfと協力してGPT-4のアイスランド語会話能力を向上させ、Free Law Projectと協力してモデルの法的文書理解能力を向上させてきた。

<<:  製造および自動化アプリケーション向けの人工知能技術の選び方

>>:  AIはイスラエルとパレスチナの紛争の偽画像を生成し、それが非常にリアルであるためメディアで引用されている

ブログ    
ブログ    
ブログ    

推薦する

...

...

EasyDLが新しくアップグレードされ、ERNIEの3つの機能によりエンタープライズレベルのNLPモデルを迅速にカスタマイズできるようになりました。

最近、百度文心は3つの主要機能をリリースし、カスタマイズされたマルチラベルテキスト分類、感情傾向分析...

...

宇宙の果ては「計算」だ! AI界の大物ウルフラム氏の最新スピーチ:LLMはコンピューティング空間を自律的に探索、シンギュラリティは今や到来

人工知能、宇宙、そしてあらゆるものを計算的に考えるにはどうすればよいでしょうか?最近、有名なイギリス...

...

...

高校の授業に人工知能が進出。全国40校がこの教材を導入

人工知能が高校の教室に導入されつつあります。最近、我が国初の中学生向けAI教科書『人工知能の基礎(高...

2021 年と自動化: 完璧な組み合わせ?

[[405206]]時が経つにつれて、技術は変化してきました。自動化に関しては、今年は徐々に成果が...

スマートフォンアプリケーションにおける人工知能の役割

人工知能がスマートフォンアプリとユーザーエクスペリエンスをどのように変えているのか。進化し続けるテク...

Nature Review: 機械学習の物理的発見 - 隣にあるもう一つの機会の道

[[437564]]この記事はLeiphone.comから転載したものです。転載する場合は、Leip...

...

市場規模が100億ドルに迫る中、外科用ロボットはどのように発展していくのでしょうか?

近年、世界各国は医療の発展に継続的に注目しており、スマート医療や精密医療などの概念がこのトレンドを活...

[ディープラーニングシリーズ] PaddlePaddle と Tensorflow を使用したクラシック CNN ネットワーク GoogLeNet の実装

以前、LeNet、AlexNet、Vgg についてお話しましたが、今週は GoogLeNet につい...

...