古い写真の修復、太陽系外惑星の発見... 素晴らしい機械学習プロジェクト 8 つをご紹介します

古い写真の修復、太陽系外惑星の発見... 素晴らしい機械学習プロジェクト 8 つをご紹介します

[[337579]]

カジャル・ヤダブ

マシンハートが編集

編集者: シャオ・ジョウ、ドゥ・ウェイ

人工知能の波の中で、多種多様な機械学習プロジェクトが存在します。代表的かつ実用的なプロジェクトはどれでしょうか? 最近、Kajal Yadav という著者が、実用的で興味深い 8 つの古典的な機械学習プロジェクトをリストしました。現在、Medium で 1.7K 件のいいねを獲得しています。

これら 8 つのプロジェクトのトピックには、感情分析、自動要約生成、感情検出、古い写真の修復、ディープラーニングによる音楽生成などが含まれます。

[[337580]]

カジャル・ヤダブ

ソーシャルメディアに基づくうつ病の分析

[[337581]]

画像ソース: Unsplash、写真提供: dole777。

これは非常にデリケートな問題であり、対処する必要がある緊急の問題であると考えられています。世界中で2億6,400万人以上がうつ病に苦しんでいます。うつ病は、世界中で障害の主な原因の一つであり、世界の疾病負担の大きな部分を占めています。毎年80万人が自殺で亡くなっています。自殺は15歳から29歳までの人々の死亡原因の第2位です。残念なことに、うつ病の治療は遅れたり、不正確であったり、まったく効果がない場合がよくあります。

インターネットベースの生活は、特に若年層におけるうつ病の早期治療サービスを変革する機会を提供します。

ピュー・リサーチ・センターが指摘しているように、72%の人がインターネットを利用しています。ソーシャル ネットワークで公開されるデータセットは、人文科学や脳研究など、多くの分野にとって非常に重要です。しかし、専門家コミュニティからのサポートだけに頼るだけでは不十分であり、明示的な方法論は効果的ではありません。

したがって、ソーシャル メディアの投稿にある象徴的な言語を分析することで、新しいディープラーニング モデルを作成できます。このモデルは、従来の方法よりも早く人々が自分自身の心理状態についての洞察を得るのに役立ちます。

ニューラルネットワークによるスポーツビデオのテキスト要約の生成

[[337582]]

画像出典: Unsplash、撮影: Aksh Yadav。

このプロジェクトのアイデアは、主にスポーツゲームのビデオから正確な要約を抽出することに基づいています。一部のスポーツウェブサイトでは、試合のハイライトを配信しています。抽出テキスト要約のタスクでは、さまざまなモデルが登場していますが、その中でニューラル ネットワークが最高のパフォーマンスを発揮します。一般的に、要約の作成とは、記事の要点を強調しながら事実情報を伝えることに重点を置き、記事の情報を簡単に紹介することを指します。

ゲーム ビデオのアウトラインを自動的に作成すると、ゲームの最高の瞬間やハイライトを見つけるのが難しくなります。そのため、3次元畳み込みネットワーク(3D-CNN)、リカレントニューラルネットワーク(RNN)、長短期記憶ネットワーク(LSTM)などのディープラーニング手法を使用できます。同時に、機械学習アルゴリズムを使用してビデオを複数のセグメントに分割し、サポートベクターマシン(SVM)、ニューラルネットワーク(NN)、k平均法アルゴリズムなどを適用することもできます。

CNN を使用した手書き方程式ソルバー

[[337583]]

画像出典: Unsplash、Antoine Dautry 撮影。

すべての問題の中でも、手書きの数式認識は、コンピューター ビジョン研究の分野における最も難解な問題の 1 つです。画像処理技術を活用した畳み込みニューラル ネットワーク (CNN) の助けを借りて、手書きの数字と数学記号を使用して手書き方程式ソルバーをトレーニングできます。このようなシステムを開発するには、機械が十分に学習して望ましい予測を行えるように、データを使って機械をトレーニングする必要があります。

NLP を使用したビジネス会議の要約の生成

[[337584]]

画像出典: Unsplash、Sebastian Herrmann 撮影。

全員がレポートの内容全体ではなく概要だけを見たいと思っている状況に遭遇したことはありませんか?私たちが学生だった頃、レポートの作成に多くの時間を費やしていましたが、先生たちは要約を読む時間しかありませんでした。

要約は、過剰なデータの問題を解決するための不可欠かつ効果的な方法となっています。会話から情報を抽出することは商業的にも教育的にも大きな価値があり、会話構造から統計的、言語的、感情的な特徴を捉えることで対応できます。

通常、レポートを手動で要約するにはかなりの時間がかかりますが、自然言語処理 (NLP) を使用するとはるかに簡単になります。ディープラーニングでテキスト要約を生成すると、記事全体の文脈を理解できるため、ドキュメントの要約をすばやく生成する必要がある人にとって非常に便利です。

顔認識を使用して感情を検出し、曲を推奨する

[[337585]]

画像出典: Unsplash、Alireza Attari による写真。

人間の顔は人体の重要な部分であり、特に人の心理状態を理解する上で重要です。顔認識を使用して気分を検出し、曲を推奨すると、手動で曲を分類する手間が省けるだけでなく、人の感情特性に基づいて適切なプレイリストを生成するのにも役立ちます。

人々は気分や興味に応じて音楽を聴く傾向があります。そのため、顔の表情を捉え、ユーザーの感情を認識し、それに応じた曲を推奨できるアプリケーションを作成できます。

コンピューター ビジョンは、コンピューターを使用してデジタル画像やビデオを高度に理解することを目的とした学際的な分野です。コンピューター ビジョン コンポーネントを使用すると、顔の表情を通じてユーザーの感情を判断できます。

記事「感動と関心を抱かせる 20 以上の感情認識 API」では、興味深く実用的な 20 以上の感情認識 API を紹介しています。

記事リンク:

https://nordicapis.com/20-emotion-recognition-apis-that-will-leave-you-impressed-and-concerned/

ケプラーなどの宇宙船が撮影した画像から居住可能な太陽系外惑星を見つける

[[337586]]

画像出典: Unsplash、撮影: Nick Owuor。

過去 10 年間で、太陽系を通過する惑星を特定するために 100 万個を超える恒星が監視されてきました。太陽系外惑星候補の手作業による解釈は膨大な作業であり、人為的ミスが発生しやすく、その結果を評価するのは困難です。畳み込みニューラル ネットワークは、ノイズの多い時系列データ内で、最小二乗法よりも高い精度で地球に似た太陽系外惑星を識別するのに適しています。

古い写真の修復

画像出典: Pikist

破損した写真を原始的な方法で復元するのは非常に時間がかかり、面倒です。そのため、ディープラーニングを通じてあらゆる画像の欠陥(ひび割れ、傷、穴など)を見つけることができ、画像復元アルゴリズムの助けを借りて、ピクセル値に基づいて欠陥を簡単に見つけて、古い写真を復元したり、古い写真をカラー化したりすることもできます。

ディープラーニングによる音楽生成

[[337588]]

画像出典: Unsplash、撮影: Abigail Keenan。

音楽は変化する周波数のメロディーです。したがって、自動音楽生成とは、人間による調整を最小限に抑えて短い音楽を作成するプロセスです。最近、ディープラーニング エンジニアリングがプログラムによる音楽生成の最前線になっています。

[この記事は51CTOコラム「Machine Heart」、WeChatパブリックアカウント「Machine Heart(id:almosthuman2014)」によるオリジナル翻訳です]

この著者の他の記事を読むにはここをクリックしてください

<<:  Ascend College Suzhou Technology オープンデーが間もなく開催されます。技術的な知識と実践的な経験が得られます。

>>:  ドイツの中小企業の35%以上がすでに人工知能技術を活用

ブログ    

推薦する

超強力なTP-Link!北京大学と清華大学が共同で一般AI実験クラスを設立、朱松春氏が指導

史上最強の集団が力を合わせてAI開発に挑む?最近、北京大学の公式Weiboアカウントは、北京大学と清...

30秒で署名、上海の核酸採取ロボットが登場!

COVID-19の流行が続き、核酸検査が広範囲で徐々に常態化している中、複数の組織が核酸検査用ロボ...

新しい報告書が確認:慎重に扱わなければ、人工知能は現実版「ブラックミラー」になる

新しい報告によると、私たちは人工知能革命の瀬戸際に立っている。この革命において、私たちが作り出すテク...

人間の仕事が危機に瀕しているか?この時代にいかに目立つかが非常に重要です

序文「データ奴隷」現象は、AI時代の新たなエリート層を生み出したが、同時に、すでに強大な企業をさらに...

シャッフルアルゴリズムの2つの実装の比較

方法1: ランダム生成まず、非常に一般的な方法であるランダム生成法(私が名付けました)を紹介します。...

実践に最適なオープンソース機械学習プロジェクト 30 件をすぐに集めましょう。

「この記事は素晴らしいです! 実用的なプロジェクトがたくさん含まれており、機械学習を学び始めたばか...

ディープラーニングは廃れつつあるのでしょうか?ベンジオ氏と他の専門家がNeurlPS2019でアドバイスを行う

状況はますます明らかになりつつあります。 AIが直面している課題は、計算能力を高めたり、より多くのデ...

Python+AIで静止画像を動かす

こんにちは、みんな。短い動画を見ているときに、こんな動画を見たことはありませんか?動画の中で、人物の...

マスク氏:ニューラリンクが初めて人体にチップを埋め込み、製品化へ

マスク氏の脳コンピューターインターフェース企業ニューラリンクがついに人間に対する臨床研究を開始した。...

AI画像認識は無関係? Google AI: 段階的なトレーニング セットで画像の説明精度を向上

絵を千語で説明できるとしたら、絵の中に描写できる詳細や物体間の関係性は実に多くあります。犬の毛の質感...

ヒントン氏の「AIは常識を持つ」という予測は、どうすれば実現できるのか?ケンブリッジ大学の最新研究:子犬から学ぶ

常識は常に AI の開発を悩ませてきた難しいパズルでした。たとえ AI が囲碁で人間に勝ったとしても...

Qi Lu: 私はこれらの4つの技術トレンドに最も楽観的です

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

私が人工知能に興味がない理由

私がビジネスを始めたいと思っていると聞いて、いくつかの「馬鹿げた」アイデアをくれた人もいました。彼ら...

Google の自動運転車の秘密の世界を解明: 初めて公開された強力なツールの数々

[[201428]]アトランティック誌は今週、アルファベット傘下の自動運転企業ウェイモの謎を解明す...