私はバスケットボールが好きです。私はバスケットボールをしたり、観戦したり、バスケットボールについて語ったりするのが好きです。時々、私は友達と「コービーとレブロンが1対1で対決したらどちらが勝つだろう?」といった話をしていました。この機械学習プロジェクトを利用して、私の大好きなバスケットボールとデータサイエンスという 2 つの趣味を有機的に組み合わせる必要がありました。 昨夏、ゴールデンステート・ウォリアーズはNBAファイナルMVP(最優秀選手賞)を2年連続で受賞したケビン・デュラントをデアンジェロ・ラッセルと交換した。スポーツアナリストたちは、ラッセルがウォリアーズに適合するかどうかについて、次のように推測し始めている。 出典: クラッチポイント また、私はこうも考えました。デアンジェロ・ラッセルはウォリアーズにどうフィットするだろうか?機械学習を使ってNBA選手を分類し、選手が特定のチームとどの程度相性が良いかを予測することは可能だろうか? このプロジェクトの研究目的は、過去の活動やスペースの利用に基づいて、いくつかの選手のタイプとピッチ上での彼らの役割を特定することです。 得点、リバウンド、アシスト、スティール、ブロックなどの統計は、プレー時間や得点などの統計(これも機能には表示されません)に依存するため、機能として使用されません。得点、リバウンド、アシスト、スティール、ブロックなどのデータを特徴として使用すると、最終結果がこれらの特徴に密接に関連することになり、このプロジェクトの本来の意図から逸脱する可能性があります。以下の研究方法のセクションで、すべての特徴を詳しくリストします。 データ データ部分を見てみましょう。 データは、Python および Selenium パッケージを使用して stats.nba.com から抽出され、処理されます。選択された特徴のほとんどは、出現頻度に基づいています。多くのプレイスタイルには、攻撃と防御の両方のポジショニングが含まれます。たとえば、「オフェンス ポストアップ率」は、プレーヤーがポストアップ時にオフェンス ポジションにいる頻度を指します。また、「ディフェンス ポストアップ率」は、プレーヤーがポストアップ時にディフェンス ポジションにいる頻度を指します。これらの特性の説明については、次のリンクを参照してください: https://stats.nba.com/help/glossary/。 サンプルデータ: 272 人のプレイヤー 初期データセットには 531 人のプレーヤーが含まれています。シーズンの半分未満、1,000 分未満しかプレーしなかった選手はサンプル データから除外されました。これを実行する原則は、パフォーマンスが不安定なプレーヤーをすべて削除することです。プレーヤーの完全なサンプルリストは次のとおりです。 選手リスト 選択された機能: 41 審査前の機能の総数は600を超えました。最後に、ポジショニングとドリブルを記述する特徴が選択されました。
研究方法とモデルの選択 このプロジェクトは教師なし学習であるため、生成される結果にはさらなる分析が必要です。モデルとクラスターの選択には 2 つの目標があります。 1. クラスター間の重要な違いを強調します。プレーヤー間のスタイルの違いについて結論を導き出すには、クラスターの数が少なすぎ、各クラスター内のサンプル数が多すぎます。 2. クラスターを過度に増やさないでください。各プレイヤーがクラスターである場合、結果は各人が独立した個人であることを示すことしかできず、研究にはほとんど役立ちません。 モデル選択: DBSCAN、K平均法、平均シフト 上記の 3 つのモデルの中で、K-Means は研究目的を最も効果的に達成します。 DBSCAN と Mean Shift はどちらも、1 人のプレーヤーのみを含む複数のクラスターを含む結果を生成します。 クラスター数: 10 バスケットボールのコートには 5 つのポジションがあるので、クラスターの数を 5 の倍数にすることにしました。 10 個のクラスターは、私が思い描いた研究アプローチに適合しています。 研究結果 結果を使用して、各グループのすべての機能の平均を計算し、最も高い機能と 2 番目に高い機能に基づいて各グループをランク付けしました。用語は次のように定義されます: 主要な特性: リストされた特性の平均値はグループ内で最も高くなります。二次特性: リストされた特性の平均値は、グループ内で 2 番目に高くなります。 さらに、他のプレイヤーと比較できるように、各グループの主な特徴を示す棒グラフも提供されます。 グループ1
ステファン・カリー
主な特徴: アイソレーションショットの防御率 二次的特徴: ハンドオフ防御率、スクリーン ショット防御率、スクリーン ショット防御率、ポストアップ防御率、速攻率、ハンドオフ攻撃率、スクリーン ショット攻撃率
グループ 2 カール・アンソニー・タウンズ、ラマーカス・オルドリッジ、ジョエル・エンビード、タデウス・ヤング、ブレイク・グリフィン、アンソニー・デイビス、ニコラ・ヨキッチ、ジュリアス・ランドル、ニコラ・ブーチェビッチ、デアンドレ・エイトン、マイルズ・ターナー、アル・ホーフォード、マルク・ガソル、マービン・バグリー III、ジャレン・ジャクソン・ジュニア、セルジ・イバカ、ボビー・ポーティス、エネス・カンター、ヨナス・バランチュナス、ロビン・ロペス、マーキーフ・モリス、ゴルギー・ヤニス 主な特徴: オフェンスポストアップ率、ポストアップタッチ率 マイナー機能: オフェンスのリバウンド率調整
グループ3 P.J. タッカー、ドレイモンド・グリーン、マービン・ウィリアムズ、ジェイ・クラウダー、ブルック・ロペス、ダリオ・サリッチ、デウェイン・デッドモン、ジェフ・グリーン、ケリー・オリニク、デイビス・ベルターンス、マイク・ムスカラ、マキシ・クレバー、ジャレッド・ダドリー、マイク・スコット、ヨナス・ジェレブコ、アンソニー・トリヴァー、ヴィンス・カーター 主な特性: キャッチアンドシュート率、オフェンススポットアップ率、アンガードショット率、ディフェンスアイソレーション率、ディフェンスポストアップ率 二次的特徴: スポットアップシュート率の守備、パスがレセプションを上回る
グループ4 ジョシュ・リチャードソン、CJ・マッカラム、マイク・コンリー、ジャマール・マレー、ディアロン・フォックス、トレイ・ヤング、セディ・オスマン、エルフリッド・ペイトン、クリス・ダン、ダニー・シュローダー、エリック・ブレッドソー、マルコム・ブログドン、トーマス・サトランスキー、パトリック・ビバリー、ダニー・スミス・ジュニア、エマニュエル・ムディアイ、フレッド・バンブリート、リッキー・ルビオ、シェイ・ギルジャス・アレクサンダー、ダレン・コリソン、レジ―・ジャクソン、DJ・オーガスティン、コリー・ジョセフ、デレク・ホワイト、ライアン・アシュティアクノ 主な特徴: ディフェンスのリバウンド距離、オフェンスのピックアンドロール実行率、平均ドリブル、均一な攻撃 二次的特徴: ボール保持時間の平均秒数、オフェンスのピックアンドロール実行率、オフェンスのリバウンド距離、ロングドリブルシュート率
グループ5 レブロン・ジェームズ ジュライ・ホリデー、ポール・ジョージ、ザック・ラビーン、トバイアス・ハリス、ブランドン・イングラム、ジミー・バトラー、デビン・ブッカー、カワイ・レナード、デマー・デローザン、ケンバ・ウォーカー、ラッセル・ウェストブルック、デイミアン・リラード、アンドリュー・ウィギンズ、ドノバン・ミッチェル、カイル・アービング、ケビン・デュラント、レブロン・ジェームズ、ジェームズ・ハーデン、クリス・ミドルトン、ルカ・ドンチッチ、コリン・セクストン、デアンジェロ・ラッセル、クリス・ポール、ラジョン・ロンド、ジョーダン・クラークソン 主な特性: ロングドリブルシュート率、オフェンスアイソレーション率、オフェンスピックアンドロール実行率、ボールタッチの平均秒数 二次的な特徴: ドリブルタッチの平均回数、ディフェンスのピックアンドロール実行頻度。ディフェンスリバウンド確率調整、ディフェンスシュート率なし
グループ6 ニコラ・バトゥーム、ロンゾ・ボール、ミカル・ブリッジス、ダニー・グリーン、ケリー・ウーブレ・ジュニア、ジョナサン・アイザック、テランス・ファーガソン、ジェイレン・ブラウン、ドリアン・フィニー・スミス、ケンリッチ・ウィリアムズ、ジョシュ・オケンジ、デマーレ・キャロル、デアンドレ・ベンブリー、モーリス・ハークレス、アンドレ・イグダーラ、ロディオンズ・クルクス、ジェームズ・エニス3世、シャキール・ハリソン、パット・コノートン、ロイス・オニール、OG・アナノビー、トーリー・クレイグ、ジャスティン・ジャクソン、ブルース・ブラウン、フランク・ジャクソン 主な特性: 速攻率、ポストアップディフェンス率、ショットディフェンス率 二次的特徴: 守備のシングルショット率、攻撃のスポットアップショット率、ガードされていないショット率 攻撃速度が速い グループ7 デアンドレ・ジョーダン、モントレズ・ハレル、バム・アデバヨ、ジャマイカル・グリーン、メイソン・プラムリー、ミッチェル・ロビンソン、ザック・コリンズ 主な特徴: その他の攻撃戦術の確率、その他の攻撃の確率、接近戦でのシュート率、ディフェンスのピックアンドロール実行率、ディフェンスのスポットシュート率 二次的特徴: 対面シュート率、ディフェンスシュート率、エルボータッチ率、オフェンスカット率、オフェンスポストアップ率、ペイント/リミットタッチ率、ポストアップタッチ率 近距離射撃率 グループ8
ヤニス・アデトクンボ カイル・クーズマ、アーロン・ゴードン、ベン・シモンズ、ハリソン・バーンズ、ジェラミ・グラント、パスカル・シアカム、ヤニス・アデトクンボ、ラウリ・マルッカネン、T.J.ウォーレン、カイル・アンダーソン、ダニーロ・ガリナリ、アル・ファルーク・アミヌ、ジャバリ・パーカー、ノア・フォンレ、ネマニャ・ビェリツァ、ウィルソン・チャンドラー、マイルズ・ブリッジス、ロンダ・ホリス・ジェファーソン、マリオ・ヘゾニャ、ジェームズ・ジョンソン、デリック・ジョーンズ・ジュニア 主な特徴: ディフェンスリバウンド率、ディフェンススポットアップ率、ディフェンススクリーンショット率の変化 二次特性: ディフェンスアイソレーション率、ディフェンスピックアンドロールショット率、ディフェンススポットアップショット率、オフェンスアイソレーション率 ディフェンスリバウンドの確率の変化
クレイ・トンプソン、JJ・レディック、ジャスティン・ホリデー、ジョー・ハリス、レジー・バロック、ウェズリー・マシューズ、テレンス・ロス、アレン・クラッブ、ケンテイビアス・コールドウェル・ポープ、ランドリー・シャメット、ウェイン・エリントン、マルコ・ベリネッリ、ダリウス・ミラー、ラングストン・ギャロウェイ、カイル・コーバー、ダグ・マクダーモット、トニー・スネル 主な特性: オフェンスハンドオフ率、オフェンススクリーンショット率、アンガードショット率、オフェンスリバウンド距離、ディフェンスハンドオフ率、ディフェンススクリーン率 二次特性: 均一な攻撃速度、キャッチアンドシュート率、ディフェンスリバウンド距離 無防備なシュート率 グループ10 スティーブ・アダムス、クリント・カペラ、ルディ・ゴベール、アンドレ・ドラモンド、ジョン・コリンズ、ウィリー・コーリー・スタイン、トリスタン・トンプソン、ユスフ・ヌルキッチ、コーディ・ゼラー、ジャレット・アレン、ラリー・ナンス II、ウェンデル・カーター II、デマンタス・サボニス、タージ・ギブソン、ドレイク・フェイバーズ、ドワイト・パウエル、ジャベール・マギー、ハッサン・ホワイトサイド、トーマス・ブライアント、アレックス・レン、ケボン・ルーニー、エド・デイビス、イビツァ・ズバッチ、ヤコブ・ポエルトル、アンテ・ジジッチ 主な特徴: オフェンスのピックアンドロール実行率、オフェンスのカット率、シュート率、オフェンスのリバウンド確率調整、パス数対レセプション数、エルボータッチ率、レーン/ペイントタッチ率 二次的特徴: 接近戦シュート率、守備ポストアップ率、攻撃その他の確率、攻撃戦術その他の確率 3秒ゾーン/ペイントエリアタッチレート その結果は私を驚かせた。通常、NBAのトップシューティングガードであるステフィン・カリーは他のスター選手と同列にランクされるはずですが、今回使用したモデルでは、彼はほとんどの選手が平均的な能力を持つ第1グループに分類されました。対照的に、第 5 グループには多くのスター選手が含まれています。ボールハンドリング選手としての主な特徴は、ロングドリブルシュート率、攻撃シングル率、攻撃ピックアンドロール実行率、平均タッチ秒数です。 各グループのデータ特性について詳しく議論したいのですが、これはデータ サイエンス プロジェクトなので、代わりに以下のデータ視覚化の問題に焦点を当てます。 結果の視覚化 41 次元すべてを視覚化することは難しいため、主成分分析 (PCA) を適用して 41 次元を 3 次元に削減しました。主成分分析に馴染みのない読者のために、定義を述べておきます。「主成分分析は、すべての次元が直交し (つまり、互いに線形独立し)、それらの間のデータの違いに従って配置されるように、新しい一連の次元 (または一連の基本的なアイデア) を見つける役割を担います。つまり、主成分分析では、より重要な原則が保持されます。」 K-means 出力と主成分分析の次元削減の結果を組み合わせると、次のスクリーンショットに示すように、Plotly で 3 つの 3D クラスターが生成されます。 3Dチャート 3 次元空間により、クラスター間の違いがわかりやすくなり、K 平均法によって 41 次元が 4 つのクラスターに分割される様子もグラフで直感的に確認できます。 結論と考察 元の質問に戻ります。デアンジェロ・ラッセルとステフィン・カリーは効果的に協力できるでしょうか? では、グループ 5 に戻りましょう。 ウォリアーズはケビン・デュラントをデアンジェロ・ラッセルと交換した。この二人は、第 5 グループ、つまりボールハンドリング プレーヤーに属します。 したがって、ウォリアーズのスティーブ・カー監督への私のアドバイスは、カリー選手とラッセル選手を同時に起用することです。もちろん、彼はこれを予期していたはずであり、モデルが彼にアドバイスを与える必要はなかった。ラッセルがボールハンドリングをより多く担当し、カリーがオフボールの役割をより多く担うことが予想される。 今後は、各グループのプレイヤーを一人ずつ分析し、グループ内の主要特性と副次特性の観点から各プレイヤーのパフォーマンスを調べていきたいと考えています。分析的な内容を追加し、物事がうまくいっていない領域を改善する方法や、チーム内での選手の役割を再配置する方法などについて考えると、選手のパフォーマンスを向上させるのに役立ちます。 |
<<: 2019 ディープラーニング フレームワーク対決: PyTorch がトップ AI カンファレンスを席巻し、NeurIPS 2019 で再び優勝!
>>: 面接に合格してNLPの扉を開くのに役立つNLPの簡単なガイド
本発明は、Bzip2 アルゴリズムのハードウェア アクセラレーション実装方法を開示する。この方法は、...
はじめに:強力な人工知能の開発は近年の関心事となっています。単にラベル付けされたデータではなく、人間...
プラットフォームを選択するための第一の原則は、「データに近い」ことです。コードをデータの近くに保つこ...
サポートベクターマシン (SVM) [[326874]]サポート ベクター マシンとは何ですか? サ...
OpenAIは史上初の買収を正式に発表した。先ほど、OpenAIが「Minecraft」のオープンソ...
今日のロボットで重要な役割を果たしているいくつかの主要なセンサー技術には、磁気位置センサー、存在セン...
ビッグデータの計算分析は決して時代遅れではありません。それどころか、データ量が増え続けるにつれて、デ...
CISO、CSO、およびそのチームは毎日、侵害を検出し、リスクを評価し、適切に対応するという課題に直...
人工知能 (AI) と機械学習 (ML) は成長サイクルのピークにあるかもしれませんが、だからといっ...
[[195357]]パーソナライズされた推奨はビッグデータ時代に欠かせない技術であり、電子商取引、情...
[[258657]]近年、人工知能(AI)は急速に発展しています。今後、AIはどうなるのでしょうか...
[[423479]]はい、タイトルの読み方は正しいです。特にインダストリー 4.0 では、AI と神...