この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 前の世代の年長者たちがキッチンでおいしい料理を準備し、次の世代の子供たちは横で楽しくゲームやおもちゃで遊んでいます。あなただけが、上半身は明るくてきれいな服を着て、下半身はパジャマに裸足で、ビデオ会議ソフトウェアの中で人間のように振る舞い、退屈な会議の議題を次々と処理しています。 因果応報、今度は在宅勤務の外国人がビデオ通話によるオフィスワークで発狂する番だ。 中には不満を言う人もいました。 私たちは Zoom によって作成された仮想世界に住んでおり、一日中 Zoom の中で生活しています。 在宅勤務で日常生活に戻れると思っていても、実はZoomで生活をシミュレーションしているだけなのです。 さて、オフラインになってサボってもいいですか? 上司は気づくでしょう。 まともなことをして、私が猫と遊んだり、どうぶつの森に行ったりしている間に、私に代わって会議を開いてくれるロボットを作ったほうがいいでしょう。 いいアイデアですね。マット・リードというアメリカ人がそれを実行し、Zoom ミーティング専用のスタンドインを作成しました。 Zoombot はオープンソースで、試用可能です。操作は簡単で、プロセスはまったく複雑ではありません。 バーチャルな自分を作る方法地球上にすでに存在するテクノロジーを使って、ビデオ会議に出演できる仮想人物を作成するにはどうすればよいでしょうか? 他の人が何を言っているかを理解するには、音声テキスト変換と意味理解のテクノロジーが必要です。 他の人に応答するには、複数ラウンドの会話と TTS 機能が必要です。 話すときにはリップシンクや表情も必要であり、そのためには GAN を使用する必要があります。 また、業務に関連した事項についての議論であるため、業務に関連する業務分野のナレッジマップを準備する必要がある。 会議に出席していない場合は、会議の内容と上司から新しいタスクが割り当てられたかどうかを要約する必要があります。要約できる自然言語生成システムが必要です。 … さらに、その効果は現実的でなければならず、上司に間違いが発見されないようにする必要があります。 なんてことだ、そんなにたくさんのスキルを知っているのに、なぜまだ働かなければならないのですか?自分でビジネスを始めたほうが良いのではないですか? マットはあまり知識がなかったので、最も単純かつ残酷な方法を使用しました。 自分のビデオを録画し、一文ずつ応答を設定します。 とにかく、「職場用語」は少なく、「えーっと」「わかりました」「ちょっと待ってください」でやり過ごす人が常にいます。 そこでマットは、画面録画ソフトウェアを使用して、コンピューターの前にいる自分の映像を録画しました。彼は Mac の QuickTime を使用して画面を録画し、次のように返信を設定しました。 -"大丈夫ですか?" - 「ご心配ありがとうございます。」 - "わかりますか?" - 「よく聞こえません。」 -"バイバイ!" -「ああ、後で話そう。みんな気をつけてね。」 その後、仮想ウェブカメラを設置し、Zoomの入力をこの仮想ウェブカメラに設定します。こうすることで、ビデオ会議を行う際に、同僚のパソコンに送信される映像は、その場でカメラが録画した内容ではなく、Mattさんが事前に録画した映像になります。
こうして映像と音声で、会議ロボットが完成します。 面白い部分は彼が担当しているのですか?あなたは少し懐疑的かもしれません: それでおしまい?本当に真実を隠せるのでしょうか?上司になるなんてバカなことですよね? マットは同僚との会議でこれを試してみたところ、全員が大笑いしました。 確かに自動で返事をしてくれるし、セリフもかなりアクティブだったんですが、コマ送り効果や単語が飛び出す音など、エンターテイメント作品っぽさを感じましたね、ハハハハハ。 言わざるを得ませんが、このマット兄弟は、まさにサボり界の江太公であり、職場の案山子であり、大小さまざまな会議を延々と開催する上司を嘲笑する模範です。
これまでたくさんのロボットを見てきましたが、このロボットは本当にユニークで、他のロボットとは一線を画しています。 プロデューサーは広告会社だった それで、この会議ロボットを使って上司を騙したマットは失業保険を受け取ったのでしょうか? 考えすぎです。彼はイアン・グッドフェローもフォローする技術的かつ創造的な専門家です。 ただ、「善人」グッドフェローが彼に何らかの指導を与え、GAN を追加して会議ロボットのビデオをよりスムーズにするかどうかはわかりません。 マットの面白い会議ロボットは、実は「Red Pepper」というクリエイティブ企業のクリエイティブ技術専門家としての彼の仕事の一部です。
△この椅子の使い方はなかなか独創的だ 言い換えると、「クリエイティブ企業」のほとんどは「非常にクリエイティブなソリューションを提供する広告会社」です。たとえば、皆さんがよくご存知の日用品会社は、「ドライブ」広告で有名です。これらの「ドライブ」のアイデアは、広告会社 Huanshi Interactive から来ています。 つまり、マットはこんなに面白くて魔法のようなものを作ったにもかかわらず、真剣に仕事をしているのです。 例えば、彼らはかつて、NLP モデル GPT-2 によって作成されたレシピを実際に調理したことがあります。 GPT-2: フライドコーンポテトピザ シェフのエド・バーガー・ジュニアは最近このポテトピザのレシピに注目しましたが、あなたにも気に入ってもらえたら嬉しいと思います。よくやった、シェフ。前菜として、スライスしたイチゴ 4 個と一緒にテーブルに置き、一緒にお召し上がりください。 レッドペッパーチーム:
GPT-2: ??????????????????? (これは料理の名前です) 玉ねぎ860個(薄切り) セロリを薄切りにする 砕いたバルサミコ酢 酢と塩、それにチリ少々 漢方薬、できればケッパー 非乳製品チーズ 50g + 糖蜜 下の層またはジャガイモに味付けをする 栄養情報: 3400ポンドコルドバ 1人分: 17.1ドル リンゴ1/2個(粗くすりおろしたもの) レッドペッパーチーム:
残念なことに、タマネギはかなり小さくなってしまいました。 ポータル 最後に、正直に言うと、この面白いプロジェクトはオープンソース化されました。 必要な場合は、GitHub から入手してください。 https://github.com/mcreed/zoombot |
<<: 「AI論文のオープンソースコードの義務化に反対する理由」
>>: アリババがコアテクノロジーを公開:推論性能が2位より5倍速く、4つの世界選手権で優勝した方法
10月24日、チップ大手のNvidiaが人工知能(AI)コンピューティングチップ市場を独占した。現在...
[51CTO.comより引用] 近年、わが国の興行収入市場は飛躍的に成長し、2011年には150億ド...
強化学習と意思決定に関する学際会議 (RLDM) の重要な前提は、複数の分野が長期にわたる目標指向の...
ロボット工学と人工知能の発展により、多くの仕事が機械に置き換えられるでしょう。機械は、一部のタスク、...
Google と他のチームは、遺伝的プログラミングの最新の成果である AutoRobotics-Ze...
たったこれだけで、携帯電話を交換したいですか?最近話題になっている新しいAIデバイス「AI Pin」...
最近、インペリアル・カレッジ・ロンドンの研究チームは、画像の内容を変えずに画像内容をスキャンするアル...
ChatGPT のような生成 AI モデルが大量のエネルギーを消費することはよく知られていますが、そ...
今週、フランスのパリで国際コンピュータビジョン会議 (ICCV) が開幕しました。 ICCVはコンピ...
4月18日、北京メディアセンターで第2回世界情報会議の記者会見が開催された。記者会見では、中国共産...