1 週間で機械学習を始めることは信頼できるでしょうか?詳しい学習スケジュールはこちら

1 週間で機械学習を始めることは信頼できるでしょうか?詳しい学習スケジュールはこちら

[[185648]]

原著者 | ペル・ハラルド・ボルゲン

編集:魏子民、頼暁娟、張立軍

「初心者にとって、機械学習を始めるのは困難な作業のように思えるかもしれません。しかし、1 週間かけて機械学習の基礎を学んだ後、以前考えていたよりも簡単に理解できることがわかりました。」

この記事は Medium から引用したものです。著者は機械学習を始めるにあたって個人的に 1 週​​間を体験した後、機械学習を始めることに興味のある読者に使いやすい詳細なスケジュールを提供することを願って、その「下から上まで」の学習体験を皆さんと共有しました。

背景

機械学習の週を始める前に、私はこのテーマについてしばらく前から知っていて、Coursera の Andrew NG のコースの半分と他の理論的なコースをいくつか受講していました。まだ自分の知識を完全にコードに変換することはできませんが、機械学習の一般的な概念は理解しています。これもまた、私が変化を遂げるきっかけとなったのです。

たとえ基礎の多くを省略し、ボトムアップアプローチではなくトップダウンアプローチを使用することになったとしても、週末までに機械学習の問題を解決できるようになりたいと考えていました。

Hacker News に相談した結果、Python の Scikit Learn モデルから始めるのが最適だと結論付けました。このモデルは豊富なアルゴリズムの選択肢を提供し、機械学習の実践をわずか数十行のコードにまで削減します。

月曜日: 例から学ぶ

今週の初めに、Scikit Learn のビデオ チュートリアルを探して、機械学習を使用して株式に投資する方法に関する Sentdex のチュートリアル ビデオを選択しました。このビデオにより、学習の次のステップに進むために必要な知識が得られました。

Sentdex チュートリアル ビデオの優れた点の 1 つは、インストラクターがデータ収集に関するすべての手順を示してくれることです。読み進めていくと、データの取得とクリーニングには実際の機械学習操作よりもはるかに長い時間がかかることがわかります。したがって、ファイルや Web ページからデータを取得するスクリプトを作成する能力は、機械学習の専門家になるために不可欠なスキルです。

その後もこの動画を何回か見ましたが、問題に行き詰まったときにとても役に立ちました。皆さんも何回か見ることをお勧めします。ただし、このチュートリアルはデータの取得に重点を置いているため、Web サイトからデータを取得する方法をすでに知っている場合は、このチュートリアルは最適ではない可能性があります。 Udacity の機械学習入門コースの方があなたには適しているかもしれません。

火曜日: 現実世界の問題への応用

火曜日には、学んだことを実際の問題の解決に活用できるかどうか試してみたかったのです。私が一緒にコードに取り組んでいた別の開発者がイングランド銀行のデータ視覚化コンテストに参加していたので、私は彼と協力して銀行が公開したデータセットを調べました。最も興味深いデータは、銀行が数千世帯を対象にお金に関するテーマで毎年実施している「家庭調査」に関するものです。

私たちが解決しようと決めた問題は次のとおりです。

人の教育レベル、年齢、収入がわかれば、コンピューターは性別を予測できるでしょうか?

私はデータセットをいじって、何時間もかけてそれをクリーンアップし、その後 Scikit Learn を使用してこの問題に最適なアルゴリズムを見つけました。

最終的に成功率は約 63% となり、あまり理想的とは言えません。しかし、機械は少なくとも、50% の成功率でコインを投げるよりもわずかに高い確率で推測することができます。

結果を見るとやる気が湧いてくるので、Scikit Learn の使い方を大まかに理解したら、ぜひ自分で試してみることをお勧めします。

これは、機械学習を使用して現実の問題を解決できることに気付く重要な瞬間です。

水曜日: ゼロから始める

さまざまな Scikit Learn モデルを試した後、線形回帰アルゴリズムをゼロから作成してみることにしました。私がこれをやりたいと思った理由は、コンピューティング エンジンがどのように動作するのか本当に理解していないと感じたからです。

幸いなことに、Coursera にはいくつかのアルゴリズムを実装する方法に関するコースがあり、このときに大いに役立ちました。より具体的には、線形回帰の基礎となる概念について説明します。

これは間違いなく最も強力な機械学習技術であり、「内部で」何が起こっているかを理解することを強制します。いつかこれを実行することを強くお勧めします。

作業が進むにつれて、より複雑な実装を書き直す予定ですが、それは Scikit Learn アルゴリズムを試してから行いたいと思います。

木曜日:実行に移す

木曜日に、Kaggle 入門チュートリアルの一部を実装し始めました。 Kaggle は、企業や組織が投稿した問題に対する解決策を提出できる機械学習コンペティションのプラットフォームです。

機械学習の理論的かつ実践的な理解が十分に得られた後でのみ、Kaggle を試すことをお勧めします。そうでなければ、報酬よりもフラストレーションが増すことになります。

Bag of Words チュートリアルでは、コンペティション プラットフォームにソリューションを提出するための各ステップをガイドするほか、自然言語処理プロセスのシンプルでありながら興味深い紹介も行います。チュートリアルを終えた後、自然言語処理プロセスにさらに興味を持つようになりました。

金曜日:新学期

金曜日は、Kaggle チュートリアルの作業を継続し、Udacity の入門機械学習チュートリアルも開始しました。まだ学習中ですが、とても楽しいです。

これは Coursera のコースよりもはるかにシンプルで、基礎となるアルゴリズムは含まれていません。しかし、より実践的で、Scikit Learn の使い方を教えてくれます。 Coursera の Octave でアルゴリズムをゼロから作成するよりも、アルゴリズムを現実世界に適用する方がはるかに簡単です。

進む

この 1 週間の経験はとても楽しかっただけでなく、機械学習が社会でどれほど役立つかを実感することができました。学べば学ぶほど、活用できる分野が増えていきます。

機械学習に興味があるなら、数日間または数晩かけて基本的な理解を深めることを強くお勧めします。

教材の重労働に取り組む準備ができていない場合は、実際の問題を解決することでできるだけ早く学習できるトップダウンのアプローチを選択できます。

ソース:

https://medium.com/learning-new-stuff/machine-learning-in-a-week-a0da25d59850#.qw3zmizf9

[この記事は51CTOコラムBig Data Digest、WeChatパブリックアカウント「Big Data Digest(id: BigDataDigest)」のオリジナル翻訳です]

この著者の他の記事を読むにはここをクリックしてください

<<:  人工知能技術の助けを借りて、人々は携帯電話を通じて皮膚がんを診断できるようになるかもしれない

>>:  Googleの人工知能学習により低ピクセル画像も鮮明に

ブログ    
ブログ    
ブログ    

推薦する

アルトマンのYCスピーチ: ChatGPTを攻撃する者は死ぬ、私ができるからといって、あなたにもできるとは限らない

ウルトラマンのシンプルな言葉はAIスタートアップ企業を震え上がらせた。 「Shelling」Open...

あなたのお子さんは「顔スキャン」されましたか?顔認識技術がキャンパスに導入され物議を醸す

現在、顔認識の応用はますます深く広範囲になり、それが引き起こす論争もますます激しくなっています。まず...

...

...

Googleのエンジニアリングディレクターがアルゴリズム改善の背後にある数字を明らかに

Google は検索の問題を解決したと多くの人が考えていますが、Google の観点から見ると、検索...

人工知能をより深く理解するための人工知能と機械学習の12のキーワード

[[260979]]人工知能(AI)技術があらゆる分野にますます大きな影響を及ぼすようになるにつれ、...

量子機械学習モデルを構築するための Google の新しいフレームワーク、TensorFlow Quantum を探索する

[[319936]] [51CTO.com クイック翻訳] 量子コンピューティングと人工知能 (AI...

3つのステップで声紋システムを構築する方法

背景声紋検索は、その名前が示すように、話者認識であり、音を通じて話者の声を確認または識別します。声紋...

省エネ1000倍!人間の脳のようなニューラルチップはAIモデルの実行時に大幅な電力節約が可能

現在最も成功している人工知能アルゴリズムである人工ニューラル ネットワークは、人間の脳内の実際のニュ...

...

触覚がこんなにリアルになったのは初めてです!南カリフォルニア大学の2人の中国人博士が「触覚知覚」アルゴリズムを発明した

電子技術の発達により、私たちはいつでもどこでも「視聴覚の饗宴」を楽しめるようになり、人間の聴覚と視覚...

Cloudera のチーフアーキテクト Doug Cutting が Hadoop と人工知能について語る

[51CTO.com オリジナル記事] Doug Cutting 氏はオープンソース コミュニティに...

最新のClaude2.1とLlama 2をご利用いただけます。アマゾンが生成型AI開発の参入障壁を下げる

良いニュースです。生成 AI アプリケーションの敷居が大幅に下がりました。先ほど、Amazon We...

GPT-4 の出力がなぜそれほどランダムなのか、深く考えたことはありますか?

今年はAI分野で大規模言語モデル(LLM)が注目され、OpenAIのChatGPTやGPT-4が大人...

サーバーレス コンピューティングによる機械学習の解決策は何でしょうか?

1. 機械学習とサーバーレス学習1.1. 機械学習 (ML) はアプリケーション シナリオでどのよ...