2018年3月、テクノロジー教育のスタートアップであるSocraticがGoogleに買収されました。当時、わずか 10 人のこの小さな会社は、宿題アシスタント (国内メディアでは海外の「宿題ヘルパー」とも呼ばれる) を開発しました。生徒が宿題の問題を写真に撮ると、アシスタントが答えを手伝ってくれます。ソクラテスは数学に加えて、科学、文学、社会科、その他の科目の問題も解くことができます。 「裕福な家庭に入ると、深い海に入るようなものです。」Google 傘下の製品になってから、Socratic は一連の変更を経て、Google 流に再構築されました。現在、Socratic は巨人たちの間の戦いを生き残り、毎年約 50 億のクエリを処理していますが、スタートアップ チームが思い描いていた AI メンターにはまだまだ程遠い状況です。二人の創業者も相次いでGoogleを去った。 最近、Socratic の創設者の一人である Shryans Bhansali 氏が、この「豊かな時間」をブログ記事でレビューしました。 「グーグルの内部の仕組みを垣間見る貴重な機会であり、基礎となる技術のほとんどがグーグル発祥であるにもかかわらず、なぜオープンAIがLLM革命を主導したのかを説明している」と、エヌビディアのAI科学者ジム・ファン氏は記事をリツイートしてコメントした。 実際、以前、Googleに買収されたNestの創業者トニー・ファデル氏は、自身の新著の宣伝のためにメディアとの独占インタビューで、Googleの大企業病について語っていた。同氏は「愛と結婚は別物」であり、グーグルはイノベーションを阻害していると指摘した。 以下はこのブログ記事の全文であり、原文の意味を変えずにまとめたものです。 Google Play ストアでの Socratic 製品紹介 ソクラテスが2017年にシリーズBの資金調達ラウンドを開始したとき、ユーザー獲得のために収益を犠牲にすることは多くの悪影響を及ぼすことにすぐに気付きました。最初の一歩はうまく踏み出せましたが、ベンチャーキャピタリストは皆、私たちに収益計画を立てるよう求めました。計画を立てる過程で、クレジットカードを持たない高校生をユーザーベースとするアプリケーションでは大きなビジネスにはならないことがわかりました。 同じ頃、私たちはSnapchatのCEO、エヴァン・シュピーゲル氏に紹介されました。彼は、全員が協力して宿題ヘルパーをアプリに統合することを推奨しています。しかし、弊社のコンサルタントの一人は、あなたを企業開発部門の責任者に紹介すれば、最終的には買収につながるかもしれないと考え、そうなれば競争相手を連れてくるべきだと考えました。そこで私たちは、Microsoft、Chegg、Byju's、Google にアプローチしました。 もう一人の共同創業者、クリス・ペドレガルは以前グーグルで働いていた。彼は元上司と連絡を取り、彼からグーグルのカメラアプリ「レンズ」について学んだ。しかし、当時私たちは、この元マネージャーがすでにカーンアカデミーやAndroidの共同創設者らとともに、教育分野でビジネスを始めていたことを知りませんでした。会議の後、全員が AI 家庭教師の将来性について楽観的であることがわかりました。これはおそらく、私たちが 2017 年の Google の「ベスト アプリ」を受賞するのにも役立ちました。その会議の直後に私たちはプロセスを開始し、2018 年 3 月に Google が Socrates を買収しました。 私たちは、長年 Google に勤務した多くの社員で構成された同様の規模のチームと合併しました。クリスと私はプロダクトおよびエンジニアリングのリーダーとなり、AI チューターを構築し、それを Google 最大のプロダクトに導入するという任務を負いました。 その後 3 年間で、私たちは Socratic を再構築し、「Socratic by Google」として再リリースしました。検索とレンズの両方に Socratic の機能が搭載され、数学ソルバーもリリースし、数学チューターのプロトタイプを作成し、これらの機能をより多くの製品に導入しました。 その過程で、私はいくつかのことを学びました。 Google で働くことは、第二のパスポートを持つようなものです。バッジがあれば、世界中のどの主要都市に行っても、おいしい食事、デスク、そして Google の 20 万人を超える従業員全員への高速接続を備えた美しいオフィスのロックを解除できます。 驚くべきことに、ほぼすべての製品の数十億行のコード、世界中のデータセンターのリアルタイムの状態、20 年にわたる戦略文書、そして伝説的な人物 (ジェフ ディーンなど) を含む大規模なモノレポにすぐにアクセスできます。 Google は Google 流に物事を進めます。 Google は、ほとんどの企業よりも早く困難なエンジニアリングの課題に直面したこともあり、自社で使用するソフトウェアとインフラストラクチャのほぼすべてを社内で構築しました。 Google の巨大な要塞の中には、もはや外の世界は存在しません。要塞内に持ち込めるのは外の世界からのわずかな物だけであり、その場合でも非常に注意が必要です。 つまり、既存のコードベースを維持する機会がなく、ゼロから始めて、新しいチームで製品を再発見し、Google スタック上に再構築する必要がありました。機械学習システムを使用して宿題のトピックを分類するなど、私たちが解決した問題は、検索技術と基準を使用して解決する必要があります。言うまでもなく、これらの基準は私たちの基準よりも高いものです。 Google の型から抜け出すことができたのは、アプリのマスコットである「Ceebo」です。 Google のアプリ アイコンには 4 つの色とシンプルな形があります。このデザインは彼らにとってはうまく機能するが、私たちにとっては退屈なものだ。しかし、我々はあまりにも小さくて取るに足らない存在だったので、彼らは圧力をかけ、我々は反撃し、最後には勝利しました。 アイコンには引き続き Ceebo が使用され、現在 Google 全体で数十種類のバリエーションがあり、Google ドキュメントやウェブサイトにも表示されます。 Google ファミリーの遺伝子を受け継ぐアイコン シーボは確かに不純な血のようです。 単純なことを繰り返して行うと魔法のような効果が得られます。検索のベテランと協力してクエリ分類システムを再構築することで、検索がどのように構築されているかを垣間見る機会も得られました。一方で、情報検索ツールは信じられないほど奥深く、インターネット上のあらゆるページに新しい信号を計算して追加する機能は驚異的です。 一方、検索の改善のほとんどは、エンジニアがスプレッドシート上で古い結果と新しい結果を「並べて」比較することで手作業でレビューしていたことがわかりました。 Google のエンジニアリングは主に博士レベルのアルゴリズムの実装で構成されていると思われるかもしれませんし、時にはそれが真実でもありますが、検索エンジニアや AI エンジニアの仕事の多くは、例を調べ、パターンを見つけ、データを手動でラベル付けし、その他のスケーラブルではない非常に些細な分析で構成されています。これがおそらく世界トップクラスの AI チームの現実でしょう。 優秀な AI 研究者は大量のデータを手動でチェックする傾向があることに気づきました。さらに重要なことは、データを手動で素早く確認できるインフラストラクチャを構築したことです。魅力的ではありませんが、データを手動で検査すると、問題について貴重な直感が得られます。 OpenAI研究者ジェイソン・ウェイ ほとんどの質問は時間をかける価値がありませんが、意外な質問は時間をかける価値があります。 1,000 万から 5,000 万のユーザーに関わる問題のほとんどは、Google が時間を費やす価値がなく、Google の戦略にも適合しません。しかし、彼らは、自分の性質、戦略、そして誰かの昇進の目標に合った問題を解決することに多くのエネルギーを費やすでしょう。 たとえば、Socratic インターフェースの主要コンポーネントはコンピューター ビジョンです。写真を撮影し、画像内のテキストを認識するためにコンピューター ビジョンが必要です。スタートアップ企業として、私たちはサードパーティのツールを導入しましたが、機密データの漏洩から複雑なベンダー審査プロセスまで、Google 内でそれを使い続けるのは困難すぎることがわかりました。場合によっては、企業を買収してその技術を導入する方が簡単なこともあります。私たちの場合、たまたまこの問題に興味を持っていた AI 研究チームがあったので、彼らはトップクラスの博士課程の学生を雇って研究させ、6 か月以内に世界クラスの数学の問題認識 API を提供しました。 もちろん、Google と Amazon のプラットフォームを比較した Steve Yegge の古典的なブログ投稿を読めば、この世界クラスのサービスがまだ Google によって外部化されていないことがわかるでしょう。 Google は、常に変化する目標と努力のネットワークです。適切な人々が関心を持てば、驚くべきことが可能になる。たとえば、それを理解している副社長、憲章を持った研究チーム、あるいは組織の目標と互換性があるなどです。プロダクト マネージャーの仕事の半分は、こうした複雑な関係をうまく処理することであり、その後、プライバシー、信頼、セキュリティ、インフラストラクチャの容量などについて承認担当者から承認を得る必要があります。アイデアが実現可能かどうかを判断するには何十回もの会話が必要であり、それを現実のものにするには何百回もの会話が必要です。 それは祝福された道であり、適切な人々が継続的に注意を払えば、魔法のようなことが可能になります。チームの目標は四半期ごとに変わる可能性があり、「組織再編」によってチーム全体が消滅することもあるが、これは非常に一般的な現象であるため、Google の従業員は悲劇の中に喜劇を見ることができる。 これらの矢を避けたとしても、同じことをしている遠くのチームと「衝突」する可能性があります。続行できるのは 1 チームだけなので、戦う時が来ます。失われたプロジェクトの内部ユーザーは、依存していた API が「非推奨」になっていることに気付くでしょうが、代替品はまだ完全に準備ができていません。 Google 社員は素晴らしい作品を発表したいと考えていますが、多くの場合、そうすることはできません。間違いなく、食事をし、1日3時間働き、早期退職を楽しむためにここに来る人もいるでしょうが、私が会う人は皆、良い仕事をしたいと思っている勤勉な人々です。 彼らを倒したのは、検閲、頻繁な再編、過去の失敗による組織的な傷跡、そして単純なことを複雑にする世界クラスのプラットフォームだった。スタートアップ企業は多くの問題を無視することができますが、Google の社員はそうすることがほとんどありません。 また、従業員自身も私たちの足を引っ張っています。従業員は、何に対しても反対はできるが、何に対しても支持はしない賢い人々、不快な真実を語る勇気のないリーダー、明確な仕事の計画なしに雇用され、留まるために仕事をでっち上げなければならない人々です。 トップヘビーなのでコントロールが難しいです。進歩を妨げるもう一つの要因は、トップチームによって引き起こされる不均衡(トップヘビー)です。複数の成功した共同創業者と 10 ~ 20 年の経験を持つチームを持つことは、素晴らしいものを作るための秘訣のように思えるかもしれませんが、行き詰まりにつながる可能性もあります。 この構造は、探索領域が複数あり、目標が明確で、目標に到達するためにさまざまなパスを試行錯誤するための強力な自律性が必要な場合に適している可能性があります。しかし、統一された製品を作るには、明確なリーダー、方向性、そして考える人ではなく実行する人のグループが必要です。直感に反しますが、開発の初期段階でプロジェクトにあまり多くの人を追加しても、プロジェクトの進行は速くなりません。 技術的負債は現実に存在します。冗長なプロセス負債も存在します。エンジニアは技術的負債について話すことに慣れています。つまり、機能を出荷する時間を節約するために今日手抜きをすることは、期限内に返済しなければ負債が大きくなる負債を負うようなものです。優秀なチームは通常、これらの問題を静かに解決し、負債を返済します。 しかし、煩雑な手続きによって生じる負債も現実に存在します。リリースの不具合により追加のレビューチェックポイントが追加され、法的紛争を防ぐために別の法的レビューが追加されました。時間が経つにつれて、新しく準備された新機能はプロセスで行き詰まり、数か月経ってもリリースできず、その運命は不透明でした。 まれに、プロセスが短縮される場合もあります。Google は最近、厳格なパフォーマンス レビュー プロセスを年 2 回から 1 回に変更し、アンケートも長いものから短いものに変更しました。 時には外部の競争によって変化が強制され、時には圧力によって企業の衰退が加速されることもあります。 Google は ChatGPT の背後にある技術を発明しましたが、製品を発売したのは Google ではありません。同社は現在、AI分野でグーグルの優位を取り戻したい開発者と、あらゆる潜在的なトラブルを防ごうとする検閲当局との間で、ますます緊張関係が高まっている状況を切り抜けなければならない。 Google では、ゲームを正しくプレイすれば、驚くべきことが起こります。 Google にはかつて、「3 つの尊重」と呼ばれる一連の社内価値観がありました。それは、ユーザーへの尊重、お互いへの尊重、機会への尊重です。最初の 2 つは比較的理解しやすいですが、3 つ目はほとんどの人を混乱させます。私の理解では、あなたは Google に勤めており、Google は優秀な人材を豊富に抱え、非常に収益性の高い企業です。いいお金を稼ぎ、おいしいものを食べ、シリコンバレーの楽園で暮らしましょう。こんなに幸運に恵まれたら、何ができるでしょうか? この質問に対する私の答えは、リチャード・ハミングが「あなたとあなたの研究」で述べたことと重なります (リチャード・ハミングは有名なアメリカのコンピューター科学者で、チューリング賞受賞者です。これは彼が 20 年以上前にベル通信研究所で 200 人以上の科学者に向けて行ったスピーチです。- 訳者注) - 自分の分野で最も重要な問題を見つけ、それを解決するためにできる限りのことをしなければなりません。 これは、割り当てられた仕事を最初に実行することを意味します。すべてを管理できるようになったら、Google ネットワークを使用して、計画または開発されている内容を把握し、そこから将来についての判断を統合し、ドキュメントやデモなどを通じて明確に提示し、ビジョンを共有するリーダーを見つけて、粘り強く「販売」することができます。 私はある程度これをやりました。私のお気に入りの例の 1 つは、数学を段階的に説明できる新しい数学ソルバーの AI 数学チューターのデモを 3 か月かけて構築したことです。このデモは、AI チューターのビジョンを具体化したものであり、使用および共有できるリンクが付属します。対話に基づいて、ユーザーにフィードバックを提供し、その後「生命」を得て、ユーザーに伝えられ、議論され、最終的に閉じたループを形成します。 同時に、問題点もわかりました。リーダーは私たちが向かう方向を明確に理解し、デザイナーに素晴らしいデモを作成させ、常に私たちと共有させていました。しかし、彼は間違った部署に配属され、上司は他の分野をターゲットにしていました。最終的に、彼はより調和のとれたチームに移籍し、今では彼の夢が現実になるチャンスを得ています。 多くの買収は失敗しました。ソクラテスの物語は複雑です。一方では、私たちは 2 つの非常に異なる文化をうまく融合し、製品は生き残り、年間約 50 億のクエリを処理し、Socratic チーム全体のキャリアが開花しました。 一方、クリスと私は2人ともGoogleを辞めて自分のビジネスを立ち上げましたが、SocraticチームもGoogleも、Googleの能力に匹敵するAIチューターをまだ生み出していません。しかし、組織を再編しない限り、ソクラテス的なグーグル社員の中にはそれをやり遂げられる人もいるかもしれない。 |
>>: 李開復のLLaMAに基づく企業モデルだが、テンソル名が異なっており論争を巻き起こしたが、公式の回答が来た。
[[443127]]ビッグデータの時代において、機械学習は製品の売上向上や人間の意思決定の支援に大き...
関連データによると、今年上半期、わが国のカラーテレビ市場の累計販売台数は2,000万台未満で、前年同...
ジェフ・ディーン氏は数万語に及ぶ長文の記事を公開し、過去1年間のGoogleのさまざまな分野での成果...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
自動車の知能化の時代が到来しました。 12月8日、広州で開催された第2回百度アポロエコシステムカンフ...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
【51CTO.com クイック翻訳】 [[397384]] [序文]直感に反するように聞こえるかもし...
エッジ AI とクラウド AI は、現在企業が使用している最も重要なテクノロジーの一部であることがわ...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
過去 10 年間の AI システムの進歩のスピードは驚くべきものでした。 2016年の囲碁対局でアル...
著者 | Tu Chengyeレビュー | Chonglou石炭、電力、化学などの多くの産業では、安...
自宅の高齢者が階段を降りる途中で誤って転倒したり、地域でいたずらっ子が走り回ってトラブルを起こしたり...