35 歳の技術者が管理職に転身するにはどうすればいいでしょうか?アリババの上級アルゴリズム専門家が10の考えを明かす

[[313295]]

35歳前後というのはエンジニアにとって珍しい年齢です。技術者は、純粋に技術的な立場から管理職へと、人生において変革を経験することがあります。また、チーム構築、リーダーシップ、KPI 設定に関しても多くの新たな課題に直面することになります。この記事では、アリババのシニアテクニカルリーダーである張栄氏が、昨年 1 月末に CRO ラインの NLP アルゴリズムチームを引き継いで以来、チーム構築、能力開発、管理について抱いている考えの一部を紹介します。これらの考えは実践から生まれたものであり、一連の方法論にまとめられています。移行期にある技術者にインスピレーションを与えることを願っています。

張栄（通称ウェイシ）は現在、アリババのCROラインのNLPアルゴリズムチームのリーダーを務めており、長年にわたりNLP、画像認識、ビデオ分析アルゴリズムの分野に注力してきました。

信頼があるからこそ、シンプルです。

チームの立場は？ - 正しいことをする

位置

チームの位置づけは最も重要なことの一つです。一度逸脱すると、将来やればやるほど、ミスが多くなります。チームの位置づけを決めるのに長い時間がかかり、組織の変更や 2 人の上司との多くの話し合いが必要でした。

まず、このチームはCROラインに配置され、リスク管理ビジネスにサービスを提供する必要がありますが、同時に、これは能力チームであり、ビジネスチームとの協力関係も考慮する必要があります。最終的に、私は3つの点を決定しました。

1. 能力開発が主な焦点ですが、ビジネスへの焦点も必要です。

2. ビジネスチームがすでにうまくやっていることをやらない。

3. 目標を高く設定し、さらなる高みを目指して努力し、最善を尽くしてください。

[[313296]]

障壁と価値

今は NLP の分野における大航海時代であると言っても過言ではありません。新しいアルゴリズムが絶え間なく登場し、日々変化しています。新しい波は、さまざまな方法で浜辺の古い波を粉砕しています。特にBERTの登場以降、NLP研究パラダイム全体が、当初のタスク固有のモデル構造設計から、言語モデルの事前トレーニング+下流のタスクの微調整モデルへと変化しました。事前トレーニングモデルは価値の高い仕事です。事前トレーニング済みモデルを研究すると、このゲームをプレイするには多額の資金 + データ + テクノロジーが必要であることがわかります。

これにより、ジレンマが生じます。事前トレーニング済みのモデルを開発したい場合、十分なリソースがありません。十分なリソースがない場合は、下流のタスクにオープンソースモデルを使用すると、実際には技術的な障壁はありません。実際、技術的な障壁となり得る新しいアルゴリズムを本当に思いついたとしても、2、3 か月後には誰かがもっと良い結果を思いつくかもしれません。

ジレンマの根源は、NLP アルゴリズムの分野が現在急速に発展しており、急速に変化する分野に障壁を形成することが難しいことです。したがって、私たち自身の環境に基づいて、それほど急速に変化しないものを探す必要があります。

何日も検討した結果、リスク管理の知識を蓄積することが障壁になる可能性があるという結論に達しました。理由：1) リスク知識は時間とともに変化しますが、その速度は明らかにアルゴリズムよりもはるかに遅いです。2) CRO ラインにはこの点に関して一定の蓄積があり、実際のビジネス管理にも活用して製品に沈殿させる必要があります。

したがって、私はチームの目的を「知識主導の NLP アルゴリズムチーム」と定義します。 CRO ラインやグループ全体のリスク知識を蓄積し、さまざまなレベルのサービスを提供します。

図: 4層サービスシステム

最近、CROラインは清華大学でAIとセキュリティに関するセミナーを開催し、張北院士が第3世代の人工知能について講演し、特に知識の中核的役割を強調しました。私たちは中国科学院情報工学研究所を訪問しました。同研究所の目標も知識駆動型アルゴリズムの構築です。業界との共鳴により、この道を歩むという私たちの決意と自信がさらに強まりました。

チームにはどのような能力が必要ですか?

まず、チームが置かれている環境を理解する必要があります。

アリババの組織構造はどのようなものですか?

マトリックスのようなものだと言う人もいれば、ツリー+メッシュのようなものだと言う人もいますが、正確な答えはわかりません。しかし、それぞれの小さなチームをノードと見なすと、次の 2 つの点が確実にわかります。

1. 規模が大きく、さまざまなノード（ビジネス、製品、エンジニアリング、アルゴリズム）の種類と数が多い。

2. ユニットノードは、大規模なチーム間、さらにはビジネスユニット間で接続しやすくなり、条件が整えば協力関係が生まれます。

視聴を続けると次のことがわかります:

1. 必要なリソースのほとんどすべてについて、プロバイダーを見つけることができます。多くの場合、プロバイダーは複数存在します。

2. 能力の範囲内で、さまざまな需要ノードにサービスを提供することもできます。

3. 規模が巨大であるため、需要ノードとリソースノードは互いの位置を把握していないことがよくあります。

上記を踏まえると、ミドルオフィスのアルゴリズムチームには、接続、生成、配信、サービスという 4 つの機能が必要であると私は考えています。

図: ケイパビリティセンターのアルゴリズムチームが持つべき能力

4つの機能

つながり: 必要なリソースを見つけ、最適なものを選択し、長期的かつ安定した協力関係を確立することを意味します。例えば、アルゴリズムチームに必要なクローラー、アノテーションツール、分散モデルトレーニングツール、モデル評価ツールなどはすべて社内で入手できるため、ゼロから構築する必要はありません。

制作: これは従来の意味でのアルゴリズムエンジニアの仕事であり、必要な効果と効率を満たすアルゴリズムモデルを作成するためのデータを取得し、それをオンラインにすることを意味します。

アルゴリズムの要件は、監督者の監督者によって長い間議論されてきました。アルゴリズムは完全でなければなりません! アルゴリズムは強力でなければなりません! アルゴリズムは高速でなければなりません! アルゴリズムは安価でなければなりません! これは簡潔で考えさせられるものです。これを少し分解すると、次のようになります。

図: アルゴリズムの要件

普及: これはミドルオフィスのアルゴリズムチームにとっての要件です。ターゲットビジネスノードに、自分の存在、能力、詳細を知らせる必要があるためです。

サービス: 特定のビジネスに特化したアルゴリズムチームの場合は、そのビジネスにおける SLA のみを考慮する必要があります。ミドルプラットフォームのアルゴリズムチームの場合は、開発と保守のコストが高い個別のカスタマイズを行わずに、さまざまなビジネスノードのニーズを満たす方法も考慮する必要があります。また、接続されたビジネスの数が増えるにつれて、さまざまなリソースのコストが直線的に増加することを回避する必要があります。

能力レーダーチャート

チームの能力レーダーチャートは、メンバーの個人的な能力の強みで構成されます。（単語が短いほど意味が長くなります）

図: チーム能力レーダーチャート

組織と個人の関係

なぜ組織が必要なのでしょうか?

まず、ある現象から始めましょう。コミュニティ所有者と不動産管理会社との間の紛争では、所有者が勝つ可能性は非常に低いのです。数、個人の学歴、質の面ではオーナーが絶対的に有利なのに、なぜ負けたのか？

大まかな分析をすると、主な理由が 3 つあることがわかります。

1. 共通の関心と明確な目標。物件の目標は非常に明確で、オーナーから収益を得ることであり、それは物件スタッフの共通の利益でもあります。オーナーは多数おり、それぞれ状況が異なり、それぞれの利益も大きく異なるため、簡単に分裂してしまいます。

2. 緊密な組織と相互調整。施設内では明確な役割分担があり、人々は長い間一緒に働いています。彼らはお互いを信頼し、協力し合っています。オーナー同士はしばしば面識がなく、信頼関係が欠如しており、一致団結して行動することが難しいため、オーナー同士はバラバラになり、散り散りになってしまうのです。

3. 地域的な相対的優位性。個人所有者と比較すると、不動産には明らかな権力上の利点があります。例えば、物件には資金があるものの、所有者は信頼関係がないため資金調達が難しいと感じています。

さて、小規模な組織の力は、大規模で分散した個人の集まりの力を上回る可能性があることがわかります。

組織は個人に何を提供しますか?

1. 組織化により、リソースの効率を高めることができます。組織化により、さまざまなリソースを有機的な全体に統合できるため、さまざまな分散した力が結合した力を形成し、これらのリソースと力の機械的な合計よりも高い効率を生み出すことができます。この原則は2,000年以上前にアリストテレスによって議論され、後にマルクスによってより厳密に議論されました。

2. 組織は目標達成の支えです。個人は組織の能力とリソースに頼って物事を行うことができますが、組織の能力とリソースは個人の能力とリソースよりもはるかに優れています。したがって、組織に頼ることで、個人は単独で行うよりもはるかに大きな目標を達成できます。

たとえば、私たちのチームは、オープンソースモデルを上回る UGC シーン効果の事前トレーニング済みモデルを開発しました。すべての学生はこの事前トレーニング済みモデルを使用して下流の教師あり学習タスクを実行でき、他の学生よりも高い出発点を得ることができます。

[[313299]]

個人は組織に何を提供するのでしょうか?

欠点があるかどうかはそれほど重要ではありません。重要なのは、組織の能力レーダーチャートに貢献できる強みを持っていることです。

このセクションでは、皆さんに考えてほしい質問があります。会社に監督者の役職を設ける目的は何でしょうか。幼稚園の先生と同じように、すべての子供が自分の好きなおもちゃを持って、楽しく学校に行き、安全に家に帰れるようにするためでしょうか。

採用チームが求める人材

採用はなぜそれほど重要なのでしょうか?

世界には普遍的なルールがあります。それは、前の段階で厳密に制御することで、データのラベル付け、コードの記述、モデル内の前処理など、後続の段階での実装の難易度が大幅に軽減されるということです。人材を採用した後は、その人材を活用し、管理する必要があります。採用時に高い基準と厳しい要件を設定すれば、その後の管理ははるかに容易になります。基準を下げたり緩めたりすると、採用時に怠惰になることで節約した労力よりも、その後の管理にかかるコストの方がはるかに高くなります。

そのため、私は時間の少なくとも 3 分の 1 を採用活動に費やしています。はい、少なくとも 1/3 です。その通りです。 2019年2月から現在までに、ソーシャルリクルーティングで300件以上の履歴書、キャンパスリクルーティングで100件以上の履歴書を受け取りました。統計によると、履歴書 100 件につき 2～3 件のオファーがあり、1～2 人が採用されます。 10 通の履歴書から人材を採用するよりも、100 通の履歴書から人材を採用する方が間違いなく簡単です。

私はソーシャルリクルートメントとキャンパスリクルートメントの両方を通じて、アルゴリズムチームに多くの人を募集しました。詳細な議論については、イースターエッグセクションの [採用] セクションを参照してください。

採用においてはどのような能力を評価すべきでしょうか？

採用する際には、まず仕事のモデルを決める必要があります。スペースが限られているため、「制作」段階に必要な機能についてのみ説明します。時代の背景：急速な変化、新しいアルゴリズムが絶え間なく登場。

変わらないもの：数学の基礎、コンピュータの基礎、実践能力。

新しいテクノロジーの具体的な実装を予測することは困難ですが、新しいテクノロジーが登場したときには、それを迅速に分析し、学習し、習得できる必要があります。さらに、これまで遭遇したことのない新しい問題を解決しなければならないことが多く、候補者は前例のない問題に直面したときに分析および判断し、特定の制約の下で完全な解決策を見つける能力を持っている必要があります。さらに、複雑なビジネスシナリオでは、問題に明確な答えがない場合が多く、ソリューション全体が要件を満たしているかどうかをプロセスの合理性によって判断することがよくあります。答えを見つけるプロセスは、決して順風満帆ではありません。挫折する可能性が高く、最後まで挑戦と修正を続けることが求められます。

学歴や職歴については、それほど重要ではありません。私は、社会人採用候補者の出身校、最終学位、さらには卒業から数年経った学部を考慮するかどうかにさえ同意しません。人が優れた能力を持っている場合、それを証明するために学校の学位に頼る必要はなく、自分の行動で直接証明することができます。

候補者を評価するとき、私は通常、基本的なハードスキル、革新的/オープンマインドな思考、そして精神的な資質という 3 つの側面に注目します。

[[313300]]

ハードスキル

数学：確率論と数理統計、行列理論、確率過程。コンピュータの基礎: オペレーティングシステム、構成原理、データ構造。アルゴリズムの機能: 分野における主流モデルの進化、長所と短所の比較、特定のシナリオにおける適切なソリューションの選択。実践: C++/python/Java (えっ? matlab だって? 業界ではプログラミング言語とはみなされていません)。

面接中にコードテストを求めるのは、ブラインドデート中に銀行の預金証明書を見せるように求めるのと同じくらい残酷だと言う人もいます。私はこの意見に同意します。なぜなら、多くの応募者は、コードを書かなければならないと聞くと傲慢に拒否するからです。オンラインコードテストツールをお勧めします: http://collabedit.com

私の長年の観察からすると、アルゴリズムの開発が得意な学生は実践的なスキルが強いようです。結局のところ、アルゴリズムエンジニアは何よりもまずエンジニアです。

革新的/オープンマインドな思考

実際、私はコードテストよりもさらにとんでもないことをよくやります。それは、IQ テストを行うことです。これは私が発明したものではなく、私が学んだものです。インターネットで出回っている面接の質問を直接見つけて、別の方法で使用しました。

これまでのハードスキルは結果に重点を置くことが多いですが、ここでの思考能力の検査は、方法論があるかどうか、アイデアが明確かどうか、議論を裏付ける証拠があるかどうかなど、プロセスに重点が置かれています。したがって、このタイプの質問に対するインタビュー方法は、ディスカッションベースになることが多いです。

候補者がタスクを完了できた場合は、最後に要約を作成してもらいます。要点を要約する能力とビジョンの高さを観察します。

応募者の中には、面接後も考え続けて、より良い答えを出す人もいます。

精神的な質

当社が求める人材は、楽観的であること、タフであること、賢く、自己を振り返ることができることです。

4 つの単語のうち 2 つは忍耐を強調しています。面接の過程で、私は候補者が問題解決に困ったときにどのように行動するかを観察します。時には、意図的に少し挑発的なことをして彼らの反応を観察したり、途中で意図的に制限を変えたりすることもありました。アリババ社内では競争が激しく、変化を受け入れる必要もしばしばあります。心理的な忍耐力が弱い人は、同行者としてふさわしくありません。

もう一つの非常に重要な点は、自己動機です。これは社内管理コストの削減の観点から必要なことであり、後ほど詳しく説明します。

私の意見では、ハードスキル、革新的/オープンマインドな思考、そして精神的な資質はすべて不可欠です。これら 3 つの点に満足している場合でも、上司、上司の上司、または人事部が候補者に対して明らかに疑問を抱く場合は、通常、何の議論もなく諦めます。なぜなら、彼らは私よりもレベルが高く、数え切れないほど多くの人々を見てきたし、間違いを犯すこともほとんどないからです。

学生の中には、「これをやると優秀な人材を逃してしまうのではないか」と疑問に思う人もいるかもしれません。はい、私の方法を使えば、採用する学生が間違いなく優秀であることをほぼ保証できますが、優秀な候補者を何人か逃してしまうことになります。しかし、これによって深刻な結果が生じることはありません。逆に、資格のない人を雇うと大きな問題を引き起こします。

[[313301]]

雇用

スーパーバイザーの役割は何ですか?

かつて「列車の速度は機関車次第」という言葉がありましたが、これは高速鉄道が登場する前の時代を指していました。なぜEMUや高速列車は従来の列車よりも速いのでしょうか? 根本的な理由は、ほとんどの車両が電力を供給できるからです。

同様に、チームが推進力とモチベーションの提供を監督者に全面的に依存している場合、監督者は簡単にチームのボトルネックになる可能性があります。私のチームメンバーの多くはそれぞれの分野の専門家であり、彼らの専門能力は私より優れています。私は実際の状況に適応し、自分の愚かな意見でクラスメイトのパフォーマンスを制限してはいけません。したがって、私の役割は、遠くを見てハンドルを操作し、時にはブレーキを踏むことです。チームのほとんどの生徒が一緒になってパワーエンジンを形成します。

[[313302]]

図：EMU/高速列車はほとんどの車両が動力車なので高速で走行する

内部管理モデル

不適切な比喩：羊の群れをまとめる。

これを実行する理由は、「信頼があるから簡単だ」というものです。技術的な理由により、アルゴリズムを学ぶ学生がプロセス管理を行うのはコスト効率が悪すぎます。

アルゴリズム作業では創造性が重要な役割を果たしますが、プロセス中に創造性を定量化して測定することは難しく、外部からの観察から判断することも困難です。たとえば、私の隣に座っていたクラスメートは、瞬きもせずに画面を見つめながら自分のワークステーションに座っていました。彼が論文の数式について考えているのか、昨晩見た映画のことを思い出しているのか、私にはわかりませんでした。別の例として、私は杭州に拠点を置いており、北京に拠点を置くチームメイトが勤務時間中にゲームをプレイしているかどうかを知る方法はありません。

そのため、私はクラスメートを信頼し、データセキュリティ、安全な生産など、監督しなければならない一部の事項のみを監督することにしました。他の事項については、通常はプロセス管理は行わず、結果管理のみを行います。厳格な採用プロセスのおかげで、ほとんどの学生は強い自発性を持っているので、彼らが怠けてしまうことを心配する必要はありません。逆に、少数の学生が頑張りすぎることを心配する必要があることもあります。この点についての詳細は、イースターエッグ[真剣に生き、楽しく働く]をご覧ください。

学生の中には、次のように質問した人もいるでしょう。「上で述べたのは、一生懸命働かないことを心配する必要はないということなので、一生懸命働くことの問題をどう説明するのですか? 学生にプロジェクトを行うように指導しないのですか?」

私は通常、プロジェクトの目標のみを伝えますが、大まかな計画を伝える場合もあれば、伝えない場合もあります。同社ではすでに、P6の学生に対して「自立して成果を上げる」ことを要件としており、全員が自立して働く能力を持つ必要がある。また、前述の通り、車両の動力供給はチームの生徒のほとんどが行うはずなので、私に頼る必要はありません。人間には利己心があるのでしょうか？この質問の答えは分かりません。しかし、アイデアは自分自身のものであり、決定も自分自身のものであると考えると、それを実現するための意欲が高まると私は知っています。決断を下そうとすることと、不確実なタスクを完了しようとすることは、どちらも自分自身の成長に役立ちます。

考察のための質問: 管理にはさまざまなスタイルがあります。上司の中には、需要分析を自ら行い、それを原子レベルの技術的な問題に分解して、部下に実行させる人もいます。「羊を走らせる」モデルと比較して、上司と部下の観点から見たこのモデルの利点と欠点は何ですか?

上記の 2 つの点を組み合わせると、羊の飼育は実現可能だと思います。さらに、羊飼いは羊を群れさせるときに、天気を選び、牧草地を見つけ、羊を牧草地まで導き、羊を守るために見張りをしなければならないなど、たくさんの仕事をしなければなりません。もし羊飼いが牧草を刈って羊に餌を与えなければならないとしたら、どうなるでしょうか。

羊飼いは、豊かな牧草地を見つけること、強い羊を買うこと、他の羊飼いとコミュニケーションをとることにもっとエネルギーを費やすべきです。羊に餌をやったり、怠け者の羊に早く草を食べるように促したり、喧嘩している羊を引き離したりすることに忙しくしていたら、どうして群れは強くなれるでしょうか。

チームに自信を与えるための最良の方法は何でしょうか?

一度で完全に勝利しましょう。それでも足りない場合は、2回繰り返します。

私がチームを引き継いだとき、商品化の状況は非常に悪く、昨年は競合他社との競争に 3 回敗れ、安定性の問題が頻繁に発生し、新しいバージョンをリリースできませんでした... チームの何人かがこの面で懸命に取り組みましたが、結果は得られませんでした。

このとき、もし私が『ヒトラーから世界を救った男』のチャーチルのような情熱的な演説をすれば、問題は解決するだろうか。短期的には心臓を刺激する効果があるかもしれないが、実際の困難は解決されていないので、長くは続かないだろう。それに、私にはチャーチルのような雄弁術は絶対にありません。最も有用な方法は、失敗の理由を分析し、正しい戦略を立て、生徒が成功できるように導くことです。自信を高める最良の方法は、本当の成功を経験することです。

皆さんもご存知のとおり、今年の競合他社に対する当社の記録は N:0 となり、有料通話量は 25 倍以上増加しました。誰もが知りたいのは、正しいプレイ方法とは何なのかということです。これについては、後ほど「正しいプレイ方法」のセクションで説明します。

[[313303]]

魅力的なことをする

目標はより高く、より挑戦的なものに設定する必要があります。そうすれば、目標を達成したときに、より大きな達成感を感じられるでしょう。これは簡単に理解できます。ゲームで初心者に勝ったときにはあまり喜びを感じませんが、これまで何度も負けてきた相手に勝つことができれば、長い間興奮し続けるでしょう。

目標を低く設定しすぎると、自分の潜在能力を実現できないだけでなく、些細な問題に集中する傾向が出てきます。

数日前、私の上司はプロジェクトのキックオフミーティングで、過去を振り返ったときに自慢できる何かを成し遂げたことがなければ、人生に意味はない、と言いました。私はあなたに同意します。

プロセスを楽しむ

アリババで働くのは確かに大変です。簡単に成功する人を見たことがありません。収入のためだけに働くと、その過程で必然的に多くの苦痛を感じることになります。物質的な刺激は長続きしません。昇給、年末ボーナス、オプションなど、興奮は数日間しか続きません。自分のやっていることが好きで、仕事そのものに集中し、常に達成感を得ていれば、大変でも苦痛ではない仕事にすることができます。私の家族で料理をする叔母は、取り壊し世帯です。彼女はアパートを何軒も所有していますが、毎日何軒かの家に料理をしに行きます。その理由を尋ねたところ、以前は小さなレストランを経営していたが、取り壊し後に開業できなくなったが、料理をするのが好きだっただけだと言いました。理想的には、このようなタイプの人材を雇用したいのです。

どのような仕事のスタイルを採用するか？——正しいやり方で

4オンライン

インターネットの本質はつながりであり、その最大の価値もまたつながりです。

誰が言ったのかは分かりませんが、私がこれを初めて聞いたのは「コンピュータネットワーク」の授業でした。インターネットは、人々、人々と文書、人々とデータ、人々とコード、人々と...そして仕事に必要なあらゆるものを結び付けることができます。

チームを引き継いでみると、クラスメイトの仕事のやり方が、まさに自営業の農家のようで、それぞれが独自のモデルを作り、独自のデータを使い、独自の論文を読んでいるという、完全にアトミックで分散した存在であることがわかりました。はっきり言って、ディナーパーティー以外では、これは組織だとは感じません。つまり、中国のトップインターネット企業でも、全員が農業社会と同じように生産活動を行っており、彼らはまさに「コード農家」なのです。

チームのクラスメートが、とてもうまく言っていました。「お互いの信頼を築く最善の方法は、協力し合うことです。」仕事でのコラボレーションを実現するには、仕事に関わるあらゆるリソースをオンライン化し、組織のメンバーとつながることが前提だと考え、4つのことをオンライン化することを構想しました。

図: ドキュメント、データ、コード、評価がオンラインになっています

1. オンラインドキュメント: 春節期間中に、Yuque というチームを立ち上げました。トップレベルの設計を行い、フレームワークを自分で作成し、ビジネス、テクノロジー、リソース、技術的影響、その他の仕事関連のコンテンツを学生に記入してもらいました。このようにして、すべての学生はチームのさまざまな情報やリソース、および他の学生の作業を見ることができます。現在、チームのYuqueはいくつかの関係の深い兄弟チームにも全面的に開放されています。

2. オンラインでのデータ: 学生が自分のデータを管理すると、データアイランドが形成されるだけでなく、マシンを再インストールしたり、転職したり、会社を辞めたりしたときにデータが失われることがよくあります。私たちが引き継いだとき、オンラインでのデータ管理が行われていなかったため、クリーンアップできるラベル付きデータの量は、本来あるべき量よりもはるかに少なかったのです。チームの Yan Qi は、大規模なサンプルテーブルプロジェクトに取り組み、インテリジェント認知チーム全体の包括的なラベルデータのオンライン化を完了しました。これは非常に重要です。その後、さまざまな新しいモデルを開発し、モデルを事前トレーニングすると、さまざまなビジネス、さまざまなシナリオ、さまざまなリスクに関する大量のデータが得られ、短期間で優れた結果が得られます。

3. コードをオンラインで作成: これは進行中であり、S2 の終わりまでに完了する予定です。開始点は次のとおりです。

a. コードはチームの重要な技術資産であり、セキュリティを向上させるために統一された方法で管理する必要があります。

b. オンライン操作により、チームのコラボレーションと優れたコードの共有が容易になります。

c. 基本モジュールコードを統一してメンテナンスコストを削減する

4. オンライン評価: これも進行中です。特定のタスク用にいくつかの古典的なモデルと確認済みの主流モデルを作成し、ワンクリックで自分のモデルと以前のモデルを自動的に比較して作業効率を向上させるというアイデアです。さらに、もう 1 つの機能として、クラシックモデルの結果をベースラインとして使用して、ディープモデルの正確性を検証することができます。なぜなら、深いモデルを作った場合、効果が良ければ良いのですが、効果が良くない場合、それがモデルが適用できないからなのか、コードの書き方が間違っているからなのかが分からないからです。

正しい方向を見つける

指導者の最も重要な責任の一つは、学生が混乱しているときに方向性を明確にすることです。

前回の商業化の例に引き続き、詳細は次のとおりです。政治、ポルノ、下品、広告、侮辱などに関連するテキストリスク識別のアルゴリズム機能を Alibaba Cloud を通じて商業化のためにエクスポートします。私が引き継いだとき、この仕事に専心していた同級生は3～4人いました。彼らは一生懸命働いていましたが、結果は芳しくなく、競合他社と競争しても勝ち目はありませんでした。何が悪かったのでしょうか?

分析の結果、次の問題が見つかりました。

1. 確かにコンテンツ次元の問題ですが、分類モデルのみが使用されます。

分類モデルは静的な標準の問題を解決するのに適していますが、ビジネスの急速な変化にタイムリーに対応するのには適していません。モデルの反復と更新の最大速度は T+1 または T+2 日であり、多くの人的リソースを消費します。この問題を解決するために、前任のスーパーバイザーは分類モデルにリスクワードパッケージを挿入し、アルゴリズムの同僚が保守および更新していました。運用フィードバックから悪い事例を受け取った後、それらは手動でリスクワードパッケージに追加され、定期的に分類モデルアプリケーションにプッシュされました。この複雑なメカニズムにより、辞書の構築が頻繁に行われ、アプリケーションの安定性の問題が発生しやすくなり、更新が不可能になることさえありました。

2. トップレベルの設計が不足しており、学生が独自に作業しています。

いくつかのリスクが個別にモデル化されており、技術選択の自由度が高く、starspace、SVM、CRF、kenlm、textCNNなどさまざまな技術が混在しているため、統一的に能力向上を図ることが難しく、メンテナンスも困難です。

3. 過度にパーソナライズされたカスタマイズにより、その後のメンテナンスとアップグレードのコストが非常に高くなります。

ほぼすべての少し大きいユーザー向けに個別のモデルを作成しました。有料通話の数は多くありませんが、モデルは数十種類あります。学生はモデルを頻繁に繰り返し更新するため（少なくとも週に 1 ～ 2 回）、多くの労力がかかります。

[[313305]]

何をするか？

特定の問題を解決するために特定の技術ポイントを使用するのではなく、特定のタイプの問題を解決するための技術システムを構築します。セキュリティビジネスの特性に基づいて、一般的なアルゴリズムの有効性を高めることができる基本機能または処理フレームワークを設計します。

——上記の2つの文章は私が言ったのではなく、私の元上司が言ったものです。 (注記: この記事の内容の一部は、元上司や指導者から提供されたものです。指導者から学ぶことは、自分自身を成長させる重要な方法です。)

具体的には、いくつかの解決策があります。

リスクワードパッケージ、類似性検索、分類モデル、リスク知識グラフの 4 つの方法がタスクの完了に適しており、相互に連携していることは明らかです。

リスクワードパッケージを分類モデルから分離することで、アプリケーションの複雑さとモデルの反復頻度を減らし、安定性の問題を解決します。

効果を継続的に強化するためには、分類モデルの構造を可能な限り統一し、基準を可能な限り変更しないようにする必要があります。

BERT の提案以来、NLP 問題の基本的なパラダイムは、元のタスク固有のモデル構造設計から、言語モデルの事前トレーニング + 下流のタスクの微調整モデルに移行しました。作業の焦点は、事前トレーニング済みモデルと知識の抽出に移行する必要があります。

社内コンテンツインタラクションリスク管理業務も私のチーム内ですので、グローバルな視点から問題と解決策の分析を掲載します。

図: グローバルな視点からのUGCリスク管理の考え方

学生たちは解決策を明確にした後、すぐにそれを実践しました。4月までに、彼らは基本的に消極的な状況を逆転させました。その後、彼らは復活し、有料通話の数は25倍に増加しました。モデルの更新サイクルは毎月のサイクルに縮小され、安定性が大幅に改善され、生徒はもはや投資されていません。

パフォーマンス評価

パフォーマンス評価は、利益の分布を決定し、チームにとって最も重要なことの1つです。

チームがモデルと比較される場合、評価基準は損失関数です。損失関数が決定されると、モデルの最適化方向も決定され、チームメンバーは利益を最大化するという原則に従ってこの方向にアクションを調整します。

したがって、評価基準の設計は、チームの位置、価値、およびニーズを反映する必要があります。

図：パフォーマンス評価の3次元

ビジネス結果

Alibabaにはエレガントなことわざがあります。プロセスを称賛し、結果を支払うことです。

また、ラフだが真のことわざがあります。プロセスのない結果はゴミであり、結果のないプロセスはおならです。

自分の好みに合った文章を読んでください。

Business BUに展開されているアルゴリズムチームにとって、ビジネス目標の達成を支援することは間違いなく最優先事項です。今年の初めから、AI業界は徐々にバブルを絞り出し、本質に戻り、ビジネス価値の創造を強調し始めました。

能力の改善

価値の観点から見ると、今日の最高のパフォーマンスは、明日の最低要件です。

ビジネスニーズの観点からは、規模はますます大きくなり、ビジネスフォームはますます複雑になりつつあります。

チームの関心の観点から見ると、メンバーの能力の向上は、チームの機能レーダーチャートを拡大することができます。

私は100人のアリババフォーラムに出席したときに1人の講師が言ったことを今でも覚えています。最終的には誰もがアリババを去ります。あなたが去る方法は、あなたの能力がより速く改善するか、あなたの能力に対する会社の要件がより速く増加するかによって異なります。

[[313307]]

テクノロジーの影響

技術的影響とは何ですか？

有形のオブジェクト：論文、競争結果、書籍、特許、ATA記事など。

無形のこと：内部および外部協力、外部PR、内部共有、組織でのサービス、会議への出席、レポートなど。

なぜテクノロジーの影響力を構築するのですか？

チームの4つの基本的な機能は、つながり、生産、コミュニケーション、およびサービスであり、その中には「コミュニケーション」には技術的な影響が必要です。
CROラインの「4つのコア」ミッションの中で、1つは「規制当局にとって心の安らぎを繰り返す」ことです。技術的影響は、規制当局を安心させる効果的な方法の1つです。
商業化には資格が必要です。入札に参加した学生はこれを知っています。
採用には名声が必要です。候補者に技術レベルを説明する場合、内部ビジネスの例を使用すると、共鳴するのは簡単ではありません。
市場価値を証明する必要があります。これらのことは、どこでも運ぶことができる個人技術ブランドとして機能します。

誰かが次のように尋ねるとします。

別のシナリオを想定しています。チームのアルゴリズム機能を「XXリーディング」または「XX First-Tier」と特徴づけています。

平等

チームワークの基礎は統一であり、統一の基礎は平等です。

平等の最も重要な症状は、地域、教育的背景、仕事の経験、以前のパフォーマンス、外観、性別、人の傾向など、他の要因を考慮せずに、評価プロセス中に上記の3つの項目のみをできる限り測定することです。私が思うに、結果は能力を反映しており、簡単であることが最も説得力があります。

もちろん、この世界には完全に客観的な判断がありますか？しかし、完全な平等を達成できないからといって、平等の追求をあきらめるべきではないと思います。

イースターエッグ

ここまで読んでくれてありがとう。

採用

採用は監督者の基本的なスキルです。

私がCVチームにいたとき、私は自分自身だけでなく、他のほとんどすべてのチームのために採用されています。まず、近年の採用タスクの量を見てみましょう。

図 - 長年にわたる募集タスクの累積数

誰もが間違いなく尋ねます：そんなに多くの履歴書はどこから来るのでしょうか？

私が働いているBUは、会社の外ではよく知られておらず、いわゆる協同組合のヘッドハンターが働いたことがないので、私は自分自身の方法を見つけることができません。情報源は次のとおりです。1）ソーシャルネットワーキングサイト。チームの外部の影響が将来大きく大きくなり、私はただ横になり、履歴書に圧倒されることを願っています。

たとえば、カイミを壊すために、毎晩12時以降にリリースされました出張中、タクシーでVPNを使用して彼の履歴書をつかみました。

募集では、私はこの現象を見つけました。あなたが100レベルで候補者と接触した場合、人を募集するのは簡単ではありません。その理由は、おそらく幅の広いネットを鋳造する過程で、高強度の候補者のプールが蓄積され、プールのサイズが十分に大きい場合、適切な候補者を生産することはそれほど難しくないからです。

「直接系統」について

CVチームからNLPチームに引き継いだとき、HRは元のチームから1人の人を新しいチームに連れて行く必要があるかどうかを尋ねました。

それについて考えた後、私はノーと答えました。新しいチームメンバーとの信頼を迅速に構築し、心からそれらに頼る必要があるからです。私がクラスメートを連れてくると、新しいチームの学生は彼らの心の中で何と言いますか？これは、私と私のクラスメートの間に距離と疑念を簡単に作成します。同様に、元のチームの学生は次のように思うでしょう。

チームの持続可能な開発は、すべての人に開かれている必要があり、「直接ライン」や「非方向線」などのグループを作成することは、長期的には、チームが到達できる高さと監督者の高さを制限します。

信頼のため、それは簡単です

出席者などに加えて、監督者は、その理由の信頼性に関してのみ、部下を信頼することを選択できます。

ただし、信頼を簡単に破ることもできます。監督者が部下の報告書に故意に虚偽または誇張された結果が含まれていることを発見したら、彼または彼女が再び信頼することは困難です。同様に、一部の人々の毎週のレポートは常に栄光と大きな進歩に満ちていますが、1年後、モデルの有効性と効率は改善されていないため、誰もがそれを無視することしか選択できません。

私が前に言ったことは、監督者が彼らの部下を信頼する必要があるということです。

真剣に生き、幸せに働きます

Alibabaには古いことわざがあります。残業するのは正しいです。残業していないことも正しいです。間違っているのは作業を完了しないことだけです。

私は長い間、長い間高強度で働くのが好きではありません。進捗状況に追いつくためには、段階的に残業することは受け入れられます。長期間残業する必要がある場合は、監督者の計画、評価、または取り決めに何か問題があるに違いありません。私は最近2人のクラスメートと話をしました。

もちろん、私はこの点で、特に私が引き継いだ初期の時代にはうまくいきませんでした。私は数日前に新しい6人の子孫の剣を訓練していましたが、「真剣に生きて、監督者は模範を示して、これを行うべきです。

参考文献：私はウージュンのファンです。ここでは、彼の作品のいくつかをお勧めします。

<<: 年次レビュー：2020 年の 5 つの注目すべきテクノロジートレンド、時代のトレンドに遅れずについていく

>>: サイバーセキュリティにおける人工知能の応用