自己強化型機械学習プロジェクト 10 選

自己強化型機械学習プロジェクト 10 選

機械学習プロジェクトは大きな発展の可能性を秘めています。最近、韓国の人気ドラマでもこの用語が使用され、非常にロマンチックな方法で説明されました。データサイエンスを学ぶことができるだけでなく、履歴書にポイントを追加することもできます。結局のところ、採用担当者は一般的に、あなたのスキルによってあなたの可能性を判断します。

すべてのプログラマーは、大規模なデータセットを含む大量のデータをインテリジェントに処理する方法を学ぶ必要があります。さらに、すべてのデータセットがオープンで自由にアクセス可能であることを確認します。

[[352134]]

1. アイリスデータセット

データ サイエンスの初心者であれば、これが最適な出発点となります。このデータには 150 行と 4 列しかなく、パターン認識の文献の中で最も一般的で、最もシンプルで、最もリソースが豊富なデータセットであるはずです。分類技術を学びたいですか? これで間違いはありません。

2. ローン予測データセット

これは、ローンが承認されるかどうかを予測するのに役立つ、かなりシンプルなデータ セットでもあります。保険は、分析とデータ サイエンスの手法が最も多く利用されている業界の 1 つです。このデータセットを使用すると、保険会社のデータセットから操作を実行できるため、どのような課題があるのか​​、どのような戦略が使用されているのか、影響を与える変数は何かなどを把握できます。

3. Bigmart 販売データセット

ビジネスプロセスを改善するために分析を広範に活用している他の業界としては、小売業などがあります。これは回帰問題です。このデータには販売店舗の取引記録が含まれています。店舗の売上を予測できます。機械学習を使用すると、商品のレイアウト、在庫管理、カスタマイズされた見積もりなどのタスクを巧みに管理できます。

4. ブラックフライデーデータセット

これは、さまざまなショッピング体験から得た日常的な理解だけでなく、特別なエンジニアリング スキルを探求して拡張するための標準的なデータセットです。このデータセットには小売店で収集された販売取引が含まれており、購入金額を予測できます。

5. 人間の行動認識データセット

多くの機械学習コースでは、このデータを教育目的で使用しています。このデータにより、多重分類問題である人間の活動のカテゴリを予測できます。これは、内蔵のスマート慣性センサーを搭載したスマートフォンで撮影された 30 人の録画から収集されたものです。

6. 旅行履歴データセット

ユーザー カテゴリを予測したいですか? このデータセットは 2010 年から四半期ごとに利用可能で、米国の自転車シェアリング サービスから提供されています。このデータセットでは、専門的なデータ処理スキルを発揮する必要があります。

7. 映画映像データセット

多くのページは、ユーザーが変わるとコンテンツも変わります。推奨システムを構築しましたか? ユーザーに新しい映画を推奨できます。このデータセットは、データ サイエンス業界で人気のあるデータセットです。 4,000 本の映画に対して 6,000 人のユーザーから 100 万件の評価があり、さまざまなサイズも用意されています。

8.データセットを決定する

画像内の要素を分析して識別することができます。カメラが画像認識を使用して顔を検出するのと同じです。また、28 x 28 のサイズの画像 7,000 枚を使用して、画像内の数字を認識できるテクノロジを構築してテストすることもできます。

9. 都市の音の分類

あなたは音が好きな人ですか? 周囲のさまざまな音に注意深く耳を傾けていますか? この演習では、主に一般的な分類状況でのオーディオ処理を紹介し、オーディオから音の種類を分類するのに役立ちます。 10 のカテゴリーに分類された都市の音の抜粋 8,732 個が収録されています。

10. シカゴ犯罪データセット

600万件の観測データがあり、犯罪の種類を予測することができます。企業がデータセット全体を処理できる計算能力を持っている場合、サンプルを使用することは好まれません。このデータセットは、ローカル マシン上で大規模なデータセットを処理する実践的な経験を提供します。質問は簡単ですが、鍵となるのはデータ管理です。

要約する

上記の 10 個のデータセットの中から、まず自分のスキルセットに一致するものを見つけることができます。初心者の場合は、大きなステップを踏まず、簡単なことから始めて、一歩ずつ進歩することに集中してください。

<<:  知識が求められるポストディープラーニング時代に、知識グラフをいかに効率的かつ自動的に構築するか

>>:  ドローンのアフターサービス市場の改善が必要

ブログ    
ブログ    
ブログ    

推薦する

...

Java プログラミング スキル - データ構造とアルゴリズム「多方向検索ツリー」

[[391530]]二分木問題の分析バイナリツリーは動作効率が高いですが、問題点もあります。次のバ...

ガートナー:持続可能性とデジタル主権がパブリッククラウドベースのAIサービスを選択する際の最重要基準となる

ガートナーは、2027 年までに、生成型人工知能 (生成型 AI) を導入する企業の 70% が、持...

上海の疫病対策において人工知能は何を果たしたのか?

4月8日、「上海デジタル変革リーディンググループオフィス」が主導し、上海スマートシティ発展研究所が...

BAIRは、3種類のモデルフリー強化学習アルゴリズムを組み合わせたRLコードライブラリrlpytをオープンソース化しました。

最近、BAIR は強化学習研究コードライブラリ rlpyt をオープンソース化しました。このライブラ...

ロボット犬の悩み:ネットセレブの研修生になるのは簡単だが、ビジネスの研修生になるのは難しい

ニュージーランドの広大な草原で、羊の群れがのんびりと散歩しながら草を食べており、その後ろを牧羊犬が追...

自然言語処理の他に、Word2Vec で何ができるのでしょうか?

機械学習の手法を使用して問題を解決する場合、適切なデータを持つことが重要です。残念ながら、生データは...

どのような状況で Redis のメモリ オーバーフローが発生しますか?解決策は何ですか?

Redis のメモリ オーバーフローの問題は、通常、次のような状況によって発生します。データが多す...

...

AI開発シンポジウム:機械学習を農家に役立てる方法について議論

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...

2024 年のビッグデータ業界予測 (パート 3)

ディープラーニングディープフェイクの危険性: 2024 年には、特に仮想顧客サービス環境において、消...

AIがDotAのトッププレイヤーに勝利したのは画期的なことでしょうか? OpenAIが詳細を発表

[[200484]]週末、OpenAI は世界最高峰の DotA 2 イベント TI7 (The I...

ASO チュートリアル: 評価とダウンロードの最適化と Google Play ストアのランキング アルゴリズム

この ASO チュートリアル シリーズを初めて読む場合は、最初の記事から始めることをお勧めします。 ...

デザイナーに必須の AI ツール 11 選

翻訳者 |ブガッティレビュー | Chonglou急速に進化する今日のデザイン環境において、人工知能...

...