プロジェクトを始めたいけれど、どこから始めればいいのか分からないですか?興味深いオープンソースの機械学習プロジェクト7つを試してみる

プロジェクトを始めたいけれど、どこから始めればいいのか分からないですか?興味深いオープンソースの機械学習プロジェクト7つを試してみる

プロジェクトを実行することが機械学習を学ぶ唯一の方法であり、興味深く価値のあるプロジェクトを見つけるのは難しい場合がよくあります。まだ適切なプロジェクトが見つからないと心配していますか? 心配しないでください。初心者からプロまで楽しく学習できる、便利で興味深いオープンソースの機械学習プロジェクトをいくつか見つけました。

[[332660]]

1. ニューラルトーク2

NeuralTalk2 は、Python + numpy に基づくマルチモーダル リカレント ニューラル ネットワークを使用して、画像やビデオを文章で説明するために使用されます。非常に興味深いビデオを作成するために使用できます。

リンク: https://github.com/karpathy/neuraltalk2 (4.9K)

[[332661]]

2. 古いものを取り除く

このオープンソース プロジェクトには、グレースケール画像に高品質のカラー処理を追加して驚くべき結果をもたらすようにトレーニングされたディープラーニング モデルが含まれています。簡単に言うと、このプロジェクトは、古い画像やフィルムリールをカラー化し、修復し、新しい命を吹き込むことです。これを使用して、古いフィルムや子供の頃の白黒写真をカラー化できます。

リンク: https://github.com/jantic/DeOldify (10.4K)

カラー - 1921年の子(チャーリー・チャップリン映画)

3. リアルタイム音声クローン

誰かの声を 5 秒間キャプチャした後、ディープラーニング ソフトウェアはその声を複製して、あらゆる音声をリアルタイムで生成することができます。まだ初期段階であり、ある程度の効果はあるものの、トーンを強くするほどではなく、声はかなりロボットのように聞こえます。誰かの声を複製しようとするというのは、かなりクールに聞こえますが、少し怖いですね。

リンク: https://github.com/CorentinJ/Real-Time-Voice-Cloning (18K)

4. 顔認識

これは世界で最もシンプルな顔認識ライブラリです。このモデルは、ワイルドベンチマークでラベル付けされた顔に対して 99.38% の精度を誇ります。Python またはコマンドラインで顔を認識し、操作するために使用できます。仕組みを理解したら、独自のトレーニング モデルを構築できます。私はこの顔認識システムの原理を使用して、リアルタイムのフェイスマスク検出器を開発しました。

リンク: https://github.com/ageitgey/face_recognition (34.7K)

顔認識の例

5. テコガン

この機械学習プロジェクト リポジトリを使用すると、ビデオの超解像度に TemporallyCoherent GAN のコードを使用できます。このプロジェクトを DeOldify と組み合わせると、古い映画の映像をカラー化し、品質を向上させることができます。

リンク: https://github.com/thunil/TecoGAN(2K)

TecoGANの例

6. ユーガット

皆さん、アニメを見るのは好きですか?2次元の昔からのファンなら、U-GAT-IT(画像から画像への変換のための適応型レイヤーインスタンス正規化を備えた教師なし生成注意ネットワーク)にきっと興味を持つでしょう。人物の画像をアニメーションに変換し、アニメーションでどのように見えるかを確認できます。

リンク: https://github.com/taki0112/UGATIT (5.3K)

U-GAT-ITの例

7. スレズ

ディープラーニングを使用した画像超解像度により、16x16 の入力画像を 4 倍に拡大して 64x64 画像を生成できます。下の図からわかるように、元の顔を非常に正確に再構築できます。さらにすごいのは、こうしたタイプの改修や再構築は、政府がセキュリティ目的で広く使用しており、映画業界でも頻繁に使用されていることです。

リンク: https://github.com/david-gpu/srez (5.1K)

Srezの例

機械学習プロジェクトは何千とありますが、あなたの興味を引いて役に立つプロジェクトが必ず見つかります。プロジェクトを始めて機械学習を楽しくしましょう!

<<:  SVM の原理に関する詳細なグラフィック チュートリアル!カーネル関数を自動的に選択する1行のコードと実用的なツールがあります

>>:  無線測定・制御、顔認識、ドローン検査などハイテクが「史上最難関の大学入試」を護衛

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

ディープラーニングを使用してPythonコードを自動的に補完するこのオープンソースプロジェクトは非常に素晴らしい

コード補完機能は IDE では非常に一般的です。優れたコード自動補完機能により、作業効率が大幅に向上...

2021年も人気が続く5種類のロボット

ロボットは長年にわたり開発され、無人運転の需要が継続的に解放され、主要なコア技術が継続的に進歩するに...

製造業の発展は新たな課題に直面しており、人工知能が重要な役割を果たすだろう

[[245913]]現在、製造業の発展は新たな歴史的時期を迎えており、世界各国間の競争の焦点となって...

ロボティック・プロセス・オートメーション技術の需要が急増

Adroit Market Research によると、世界のロボットプロセス自動化技術市場は 20...

...

ジェネレーションオートメーション:AI主導の労働力

生成 AI は AI の「津波」を引き起こし、AI 駆動型アプリケーションの急速な開発、広範な採用、...

人工知能の時代が到来した今、子どもたちはどんな仕事に就くことができるのでしょうか?

昨年11月には世界インターネット会議が開催され、その期間中、人工知能が私たちの生活にどのような変化を...

...

2019年のAI技術のブレークスルーをすべて見る

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

とても怖い!最初のAIはすでに詐欺行為を行っている

​​ [[250441]]​​この記事はGeek View (ID: geekview) の許可を得...

モデルが大きくなればなるほど、パフォーマンスは向上しますか? Appleの自己回帰視覚モデルAIM: そうです

過去数年間、大規模な事前トレーニング済みモデルが NLP の分野で成功を収めてきました。このようなモ...

...

Amazon SageMaker について

Amazon SageMaker は、開発者やデータサイエンティストがあらゆる規模の機械学習モデルを...