GoogleはAIモデルのトレーニングのためだけに「アメリカ版Tieba」のデータを購入するのに6000万ドルを費やした!アルトマンは第3位の株主である

GoogleはAIモデルのトレーニングのためだけに「アメリカ版Tieba」のデータを購入するのに6000万ドルを費やした!アルトマンは第3位の株主である

事件は解決しました!

先週、Redditは、匿名の企業が同社のユーザーコンテンツにアクセスしてAIモデルをトレーニングできるようにする6000万ドルの契約を結んでいたことが判明した。

今日、Reddit データの謎の購入者が実は Google であることがみんなに分かりました。

写真

現在、両者は協力協定に達したことを公式に発表しており、RedditのデータはGoogleのAIモデルのトレーニングに役立つことになる。

写真

写真

ロイター通信によれば、この契約は年間6000万ドル相当だという。

Redditの共同創設者であり現CEOのスティーブ・ハフマン氏は次のように述べた。

Reddit は、インターネット上の実際の人間の体験に関する最大かつ継続的に更新されるデータ ソースの 1 つであり、考えられるほぼすべてのトピックを網羅したリアルタイムの人間の会話の膨大でユニークなアーカイブを保有しています。

これは、検索、AI トレーニング、研究などの分野にとって非常に貴重なデータ リソースです。そのため、Reddit は今後も LLM トレーニングの中心的な要素であり続けるでしょう。

Redditの高品質コンテンツがAI企業の標的にされている

この取引のタイミングは、Reddit の新規株式公開の直前であるため微妙だ。

明らかに、Reddit は TikTok や Facebook などとの厳しい広告収入競争の中で、まったく新しい収入源を切り開いている。

昨年、Redditは、コンテンツを配信する手段として、企業にAPIへのアクセス料を請求すると発表した。現在、Reddit は Google と直接連携しています。

ここ数か月、AI モデルの開発者たちは気が狂いそうになり、合法的なトレーニング データを世界中探し回っています。

データが新たな金であるならば、ソーシャル メディア プラットフォームは間違いなく金鉱です。

写真

これまで、AI モデルのトレーニング データの多くはインターネット上の大規模なクロールに依存していましたが、この方法は著作権に関して大きな議論を呼んでいます。多くのコンテンツクリエイターは、自分のコンテンツが許可なく AI のトレーニングに使用されたことに抗議しています。

質の高いコンテンツを大量に保有するRedditが標的となった。

しかし、Reddit ユーザーはこれに同意できるでしょうか?

Redditは、ウェブ開発者のスティーブ・ハフマン氏と起業家のアレクシ・オハニアン氏によって2005年に設立されました。

ニッチなディスカッショングループが多いことで有名ですが、メンバー数は決して少なくありません。グループによってはメンバー数が数千万人に達しているところもあります。

データによると、2023年第4四半期のRedditの1日あたりの平均アクティブ訪問者数は7,310万人に達した。

写真

The Rundown AIの創設者であるRowan Cheung氏は、情報を掘り起こし、ブルームバーグが2月16日にこの年間6000万ドルの契約について報道していたことを発見した。

Reddit の新規株式公開に先立って行われたこの取引には、明らかにもっと隠された目的があった。

写真

彼はまた、この大きな取引についての自身の考えもいくつか共有した。

写真

1. ソーシャル メディア プラットフォームには大量のデータがあり、AI モデルのトレーニングに最適なリソースです。

2. Meta、X、その他の企業はRedditなどの企業に倣って独自のAIを開発することに関心を持っていますが、このような大規模な契約を締結することで、自社のデータからすぐに価値を得ることができます。

3. この取引はRedditの計画されていた新規株式公開(IPO)の前に行われ、明らかに同社の価値を急速に高めることが意図されていました。

4. Redditのコンテンツライブラリはユーザーによって無料で作成されるため、このコンテンツを商用AIトレーニングに使用することは間違いなく強く反対されるでしょう。

5. 過去2週間、GoogleはAIへの投資を増やし続け、Ultra、Gemini 1.5 Advanced、Gemmaのオープンソース化などのプロジェクトを立ち上げ、さらにRedditとの協力も加えました。

Google が追いつくために全力を尽くしていることがわかります。

OpenAIのCEOはRedditの主要株主である

同時に、ブルームバーグは、OpenAIのCEOサム・アルトマン氏もRedditの重要な株主の一人であることも発見した。

一方でOpenAIのCEOは株主であり、他方ではGoogleに6000万ドル相当の大口顧客としてデータを販売している。

誰がこのチェスゲームをプレイしているのか分かりません。

写真

先ほど公開されたS-1文書によると、Redditの3大株主はAdvance Publications、Tencent、Sam Altmanである。

このうち、アルトマン関連企業は、クラスA株789,456株とクラスB株1,140万株を含む株式の8.7%を保有している。

この数字は、わずか3.3%を保有するCEOのスティーブ・ハフマン氏の数字をも上回っている。これはまた、アルトマン氏の投票力がハフマン氏の2倍以上であることを意味する。

写真

アルトマン氏は共同設立者ではないものの、Redditの設立当初から深く関わってきた。

彼は、Redditの共同設立者であるスティーブ・ハフマン氏とアレクシス・オハニアン氏とともに、2005年にスタートアップアクセラレータYコンビネーターの創設メンバーの一人となった。

彼はまた、元CEOのイーシャン・ウォン氏が辞任した後、短期間Redditの暫定CEOを務めた。

「RedditのCEOを務めた8日間はとても楽しかったですが、もう終わりを迎えられて嬉しいです。」

写真

OpenAIが台頭し、Redditが株式公開の準備を進める中、彼は2022年にひっそりと取締役を退任した。

写真

最新のS-1申請書によると、Redditの事業成長計画の1つは、独自のAI製品の開発に加えて、人工知能企業とデータライセンス契約を締結することだという。

「2024年1月、Redditは総額2億300万ドルのデータライセンス契約を締結しました。これは2~3年間有効です。2024年には少なくとも6,640万ドルの収益が得られると予想されており、残りの金額は将来認識される予定です。」

これらの契約を通じて、Reddit の膨大なコンテンツ ライブラリをより実質的な収入源に変換することができます。

興味深いことに、RedditはGoogleとの合意を公式に発表しているものの、株主のアルトマン氏が勤務するOpenAIと協力関係にあるかどうかは明らかにしていない。

欠場するキープレイヤー:共同創設者アレクシス・オハニアン

同時に、Reddit の共同創設者 2 人の物語もこの時点で掘り起こされました。

写真

Wired が舞台裏の愛憎物語を暴露した——

Reddit は株式公開を予定しているが、最新の提出書類では共同設立者 2 人のうち 1 人しか名前が挙がっていない。

オハニアン氏の名前は消されたようだ。

Redditの共同創設者スティーブ・ハフマン(左)とアレクシス・オハニアン(右)、2016年

Redditの共同創設者であるスティーブ・ハフマン氏とアレクシス・オハニアンは大学時代のルームメイトで、8年間を一緒に過ごした。

夜になると、2人はよく一緒に「ワールド オブ ウォークラフト」をプレイし、後に協力してRedditフォーラムを作成した。Redditフォーラムは現在、約270万人のユーザーを抱えている。

しかし、レディットが最近発表したIPO計画にはオハニアン氏の名前は一度も登場しなかった。

写真

論争

2015年以来、ハフマン氏とオハニアン氏はRedditのCEOを務めている。

2020年、2人はプラットフォーム上の憎悪的なコンテンツへの対処方法をめぐって袂を分かつことになり、それ以来ほとんど連絡を取っていなかった。

Reddit の初期の頃、オハニアン氏は同社の顔でありコミュニティ文化の形成者として初期ユーザーに強い印象を与え、一方ハフマン氏は開発に注力した。

近年、ハフマン氏は徐々に主導権を握り、レディットがこれまで想像もしなかった収益モデルを模索するために知恵を絞ってきた。

写真

S-1でハフマン氏はRedditの初期の頃を語ったが、共同設立者については何も触れなかった。

ハフマン氏は、2005 年 8 月 13 日は Reddit にとって本当に活発な日だったと述べています。その日から、フロント ページが実際のユーザーからの投稿でいっぱいになったからです。

提出書類には、Redditの株式を保有する幹部や主要株主の詳細も記載されている。

オハニアン氏がリストに載っていないのは、ハフマン氏とオハニアン氏が2006年にRedditをコンデナストに売却し、所有権を放棄したためだ。

しかし、オハニアン氏はXで、レディットの元会長として、まだ数株を保有していると語った。

写真

別れ

レディットを売却した数年後、オハニアン氏はハフマン氏の同社復帰を支援し、2015年にCEOに就任した。

2017年、ハフマンはオハニアンとテニス選手セリーナ・ウィリアムズの結婚式で花婿介添人を務めた。

写真

しかし2020年、パンデミックなどの抗議活動が急増するにつれ、レディット上のr/watchpeopledieなどの暴力的なコミュニティに対するオハニアン氏の懸念は深まったが、ハフマン氏はこれらのコミュニティを禁止することには反対した。

このため、オハニアン氏は怒りのあまりRedditの取締役会を辞任し、後任として黒人を推薦した。

同社は彼の要請に応じ、スタートアップインキュベーターYコンビネーターのマネージングディレクターであり創業者の親しい盟友でもあるマイケル・サイベル氏を後任に任命した。

しかし、元Reddit従業員数名によると、ハフマン氏は社内でオハニアン氏を批判し、禁止されたヘイト系サブレディットに関する取締役会の議論を漏らしたとして非難し、オハニアン氏とまだ連絡を取っている従業員に対し、会話の内容に注意するよう警告したという。

オハニアン氏は最近WIREDに対し、取締役を退任して以来、共同創業者との関係についてはほとんど考えていないと語った。

同時に、ハフマン氏は広告主と新規ユーザーを引き付けることに重点を移す必要がありました。

彼の努力のおかげで、Redditの昨年の売上は8億400万ドルに達し、2022年から約21%増加した。損失も43%減少し、約9100万ドルとなった。

現在、Reddit の主な収益モデルは広告です。

昨年、Reddit の収益の 98% 以上は、スポーツや政治などのトピックを扱う 10 万以上のサブレディットに表示される広告から得られました。

SECに提出された書類の中で、ハフマン氏はまた、r/PhotoshopRequestなどのRedditコミュニティでのユーザー取引から利益を得ることなど、他の収益機会についても言及した。

もう 1 つの選択肢は、最新の消費者動向を研究したい投資家や、実際の会話で AI チャットボットをトレーニングしたいテクノロジー企業に投稿のコンテンツをライセンス供与することです。

これらの収入源からの収益は昨年わずか8%増加したが、IPOが近づくにつれて成長は加速する可能性が高い。たとえば、Google と最近締結した契約では、自社のデータを「自社の製品やサービスの向上」に役立てることが認められている。その見返りとして、「Google は、人々が Reddit のコンテンツを見つけ、発見し、関わり合うことをより容易にします」。

Reddit が株式を公開すれば、同社の創設者と幹部は一緒に鐘を鳴らすだろう。

しかし、Reddit の共同創設者 2 人が同時に登場することはまずないだろう。

参考文献:

https://www.reuters.com/technology/reddit-ai-content-licensing-deal-with-google-sources-say-2024-02-22/

https://www.bloomberg.com/news/articles/2024-02-22/openai-s-altman-listed-as-major-reddit-shareholder-in-ipo-filing

https://www.wired.com/story/reddit-ipo-filing-s-1-cofounder-alexis-ohanian-huffman/

<<:  スマートホテルの室内技術トレンドを探る

>>: 

ブログ    
ブログ    
ブログ    

推薦する

ディープラーニングによる超解像画像技術の概要

SRは大きな進歩を遂げました。一般的に、既存の SR 技術研究は、教師あり SR、教師なし SR、特...

顔認識:最高裁は規則に従うよう求めている

近年、顔認識技術は急速に発展し、入場時の顔スキャンや支払い時の顔スキャンに広く使用され、私たちの日常...

ジェネレーティブAIは伝統的な医師と患者の関係を破壊している

「医者はいつも正しい」という考えが何十年も続いた後、伝統的な医師と患者の関係は重大な岐路に立たされて...

エンタープライズ ソフトウェア ベンダーのジェネレーティブ AI への取り組み

2023 年は生成 AI テクノロジーが爆発的に普及した年であり、ChatGPT などのツールが研究...

Meta Digital Human 2nd Generation が登場! VRヘッドセットはもういらない、iPhoneでスキャンするだけ

Meta のリアルなデジタル ヒューマン 2.0 がさらに進化し、iPhone を使用して生成できる...

機械学習コードを単体テストするにはどうすればいいですか?

現在、ニューラル ネットワーク コードの単体テストに関する特に包括的なオンライン チュートリアルはあ...

...

人工知能におけるGNNとは何ですか?

グラフディープラーニング(GDL)は有望な研究分野であり、グラフデータに基づいた学習や分析は非常に有...

...

量子機械学習モデルを構築するための Google の新しいフレームワーク、TensorFlow Quantum を探索する

[[319936]] [51CTO.com クイック翻訳] 量子コンピューティングと人工知能 (AI...

...

顔認識のゴッドファーザー、李自青氏:技術革新が業界の未来を力づける

NVIDIA の GTC CHINA 2016 テクノロジー カンファレンスでは、数多くの業界リーダ...

IoTの未来が機械学習に依存する理由

モノのインターネットは膨大な量のデータを生成します。そのデータは、都市が事故や犯罪を予測するのに役立...

世界中で生産される食料の50%が毎年廃棄されている?

世界の食品サプライチェーンの複雑さには驚かされることがあります。何千万もの農場が何百万もの食料品店や...