プロジェクトを始めたいけれど、どこから始めればいいのか分からないですか?興味深いオープンソースの機械学習プロジェクト7つを試してみる

プロジェクトを始めたいけれど、どこから始めればいいのか分からないですか?興味深いオープンソースの機械学習プロジェクト7つを試してみる

プロジェクトを実行することが機械学習を学ぶ唯一の方法であり、興味深く価値のあるプロジェクトを見つけるのは難しい場合がよくあります。まだ適切なプロジェクトが見つからないと心配していますか? 心配しないでください。初心者からプロまで楽しく学習できる、便利で興味深いオープンソースの機械学習プロジェクトをいくつか見つけました。

[[332660]]

1. ニューラルトーク2

NeuralTalk2 は、Python + numpy に基づくマルチモーダル リカレント ニューラル ネットワークを使用して、画像やビデオを文章で説明するために使用されます。非常に興味深いビデオを作成するために使用できます。

リンク: https://github.com/karpathy/neuraltalk2 (4.9K)

[[332661]]

2. 古いものを取り除く

このオープンソース プロジェクトには、グレースケール画像に高品質のカラー処理を追加して驚くべき結果をもたらすようにトレーニングされたディープラーニング モデルが含まれています。簡単に言うと、このプロジェクトは、古い画像やフィルムリールをカラー化し、修復し、新しい命を吹き込むことです。これを使用して、古いフィルムや子供の頃の白黒写真をカラー化できます。

リンク: https://github.com/jantic/DeOldify (10.4K)

カラー - 1921年の子(チャーリー・チャップリン映画)

3. リアルタイム音声クローン

誰かの声を 5 秒間キャプチャした後、ディープラーニング ソフトウェアはその声を複製して、あらゆる音声をリアルタイムで生成することができます。まだ初期段階であり、ある程度の効果はあるものの、トーンを強くするほどではなく、声はかなりロボットのように聞こえます。誰かの声を複製しようとするというのは、かなりクールに聞こえますが、少し怖いですね。

リンク: https://github.com/CorentinJ/Real-Time-Voice-Cloning (18K)

4. 顔認識

これは世界で最もシンプルな顔認識ライブラリです。このモデルは、ワイルドベンチマークでラベル付けされた顔に対して 99.38% の精度を誇ります。Python またはコマンドラインで顔を認識し、操作するために使用できます。仕組みを理解したら、独自のトレーニング モデルを構築できます。私はこの顔認識システムの原理を使用して、リアルタイムのフェイスマスク検出器を開発しました。

リンク: https://github.com/ageitgey/face_recognition (34.7K)

顔認識の例

5. テコガン

この機械学習プロジェクト リポジトリを使用すると、ビデオの超解像度に TemporallyCoherent GAN のコードを使用できます。このプロジェクトを DeOldify と組み合わせると、古い映画の映像をカラー化し、品質を向上させることができます。

リンク: https://github.com/thunil/TecoGAN(2K)

TecoGANの例

6. ユーガット

皆さん、アニメを見るのは好きですか?2次元の昔からのファンなら、U-GAT-IT(画像から画像への変換のための適応型レイヤーインスタンス正規化を備えた教師なし生成注意ネットワーク)にきっと興味を持つでしょう。人物の画像をアニメーションに変換し、アニメーションでどのように見えるかを確認できます。

リンク: https://github.com/taki0112/UGATIT (5.3K)

U-GAT-ITの例

7. スレズ

ディープラーニングを使用した画像超解像度により、16x16 の入力画像を 4 倍に拡大して 64x64 画像を生成できます。下の図からわかるように、元の顔を非常に正確に再構築できます。さらにすごいのは、こうしたタイプの改修や再構築は、政府がセキュリティ目的で広く使用しており、映画業界でも頻繁に使用されていることです。

リンク: https://github.com/david-gpu/srez (5.1K)

Srezの例

機械学習プロジェクトは何千とありますが、あなたの興味を引いて役に立つプロジェクトが必ず見つかります。プロジェクトを始めて機械学習を楽しくしましょう!

<<:  SVM の原理に関する詳細なグラフィック チュートリアル!カーネル関数を自動的に選択する1行のコードと実用的なツールがあります

>>:  無線測定・制御、顔認識、ドローン検査などハイテクが「史上最難関の大学入試」を護衛

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

Apple、新しいGPUアクセラレーションツールCreate MLをリリース

Appleは本日、カリフォルニア州サンノゼで2018年ワールドワイド開発者会議を開催し、4つの主要な...

...

いくつかの一般的な暗号化アルゴリズムのPython実装

私たちは日常生活の中で、暗号化アルゴリズムによく遭遇します。今日は、これらの暗号化アルゴリズムの P...

「これまで作られなかった最も重要な機械」アラン・チューリングとチューリングマシン

コンピューティングは、私たちのほとんどが直感的に理解できる馴染みのある概念です。関数 f (x) =...

大規模モデルを低コストで便利に使用するには? Amazon Web Services が生成型 AI を実現する方法

現在、私たちは「百機種戦争」の時代に突入しており、テクノロジー企業は人工知能分野で主導権を握ろうと、...

反論: AIに急いで取り組むべきではない5つの理由

[51CTO.com クイック翻訳] 今日、人工知能はもはやSFの中の漠然とした概念ではなく、私たち...

GenAI 時代の 12 の新しい仕事

GenAI は人間に取って代わるのではなく、熟練労働者、つまり GenAI を管理し最大限に活用する...

10年後に人工知能のリーダーとなる国はどこでしょうか?アメリカ国民:中国であるべきだ

ロシアメディアは、中国の人工知能(AI)産業の急速な発展を背景に、米シンクタンクのブルッキングス研究...

...

清華大学の劉志遠氏:「ビッグモデルに関する10の質問」、新しいパラダイムの下での研究の方向性を見つける

大規模モデルの出現により AI 研究の新しい時代が到来し、それによってもたらされた改善は非常に大きく...

...

...

AI を理解する: 人工知能システムで説明可能性を追求する理由

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...