Panda Eats SMS: 機械学習に基づく新しいスパムフィルタリングアプリ

Panda Eats SMS: 機械学習に基づく新しいスパムフィルタリングアプリ

[[212334]]

モバイル インターネット時代に生きる技術オタクとして、私は嫌がらせのテキスト メッセージに悩まされていますが、自分のテキスト メッセージをアップロードせずに済む簡単なフィルタリング アプリケーションは存在しません。そこで私は、テスト期間中に受け取った 20,000 件以上のテキスト メッセージとユーザーから送信されたテキスト メッセージのサンプルから Panda をトレーニングしました。

iOS 11 では、開発者が視覚処理に使用する非常に強力な CoreML 機械学習フレームワークが導入されています。これを使用して、パンダが携帯電話に定着できるようにテキスト分類アプリケーションを作成します。

正確な意味認識

Panda は、大量のサンプルからスパム メッセージのテキスト パターンを学習し、複雑な意味環境のメッセージを非常に正確に分類できます。たとえば、下の図にある [JD Pay] からの 2 つの非常によく似たテキスト メッセージ。

スパムSMSの識別

テキスト メッセージをコピーし、アプリで [精度テスト] をクリックして精度をテストできます。

使い方はとても簡単

インストール後に必要なことは、「設定」→「メッセージ」→「不明なメッセージとフィルターされたメッセージ」を開いて、「パンダがテキストメッセージを食べている」を選択することだけです。パンダは静かにスパムメッセージを食べるのを手伝ってくれます。

プライバシーを重視

Panda はサーバーを必要とせず、インターネット接続も必要ありません。アプリには完全なトレーニング モデルが付属しており、CoreML を使用して携帯電話上のテキスト メッセージを分類できます。 iOS 11 のサンドボックス制限により、SMS フィルターがネットワークにアクセスしたり、メイン アプリとデータを共有したりすることもできなくなります。 iOS 11 では、クラウドベースの判断のためにテキスト メッセージを独自のサーバーに送信するように設定できますが、Panda ではこの機能は使用されません。

自動進化

Panda は急速に成長しており、分類の精度は Panda が以前に同様の情報を見たことがあるかどうかに依存します。でも、世界は広いので、食べたことのないものも必ずあるし、パンダもよく知らないときもある。自発的に、アプリ内で新しい SMS サンプルを送信して Panda に情報を提供することができます。Panda は新しいサンプルから新しい迷惑メールや通常の SMS パターンを学習します。

注: SMS サンプルを送信すると、SMS が匿名でサーバーにアップロードされます。これはローカル トレーニングではありません。Panda はクラウドで学習を完了し、それをすべてのユーザーの携帯電話に配布します。

部分日食について

Panda(教師あり学習)に教えたので、ある程度私の好みを継承しています。割引やプロモーション情報などのあいまいなテキストメッセージはスパムメッセージとしてマークします。しかし、そのような通知を受け取りたい人もいるかもしれません。それはあなた次第です。

システムの制限

iOS 11 のシステム設計により、フィルタリングされたテキスト メッセージには Apple Watch にバッジと通知も表示されます。さらに、iOS 11 では会話に基づいてテキスト メッセージがフィルタリングされます。同じ番号から嫌がらせのテキスト メッセージと通常のテキスト メッセージの両方が送信された場合、会話全体がフィルタリングされます。この現象は 5 桁の番号ではよく見られますが、10 で始まる SMS 送信ポートでは非常にまれです。

***

  • パンダのロゴは、私が大好きなパンダが後ろに転がっている写真から生まれました。
  • Panda は現在中国語のみのトレーニングを受けており、他の言語環境では動作しない可能性があります。

<<:  ディープラーニングで構造化データを処理するにはどうすればよいですか?

>>:  深センの無人バスの試験走行がWeChatモーメンツで話題に!

ブログ    
ブログ    
ブログ    

推薦する

...

...

ラブライブ!AI論文発表:生成モデルが楽譜を自動生成

有名アイドルプロジェクト「ラブライブ!」がAI論文を発表しました。そうです。最近、プレプリント論文プ...

11 の基本的なニューラル ネットワーク アーキテクチャの視覚的な説明

標準、再帰、畳み込み、オートエンコーダネットワークディープラーニングの急速な発展により、多種多様なタ...

...

【コレクション】貢献度が最も高い GitHub コレクションとディープラーニング フレームワーク 16 選

ディープラーニングは、データの経験的学習に基づく機械学習手法であり、近年発展し、人気が高まっています...

人工知能はビッグデータ天体物理学の時代へのマスターキーとなるのでしょうか?

[[387017]] 01 まさに必要: ビッグデータ天体物理学の時代が到来観測技術の発展により、...

人工知能は実際に最大25%の精度でパスワードを推測できる

米国のスティーブンス工科大学は、ユーザーが使用するパスワードを4分の1の精度で適切に推測できる、いわ...

Google の家庭用ロボットがスタンフォード大学のエビ揚げロボットに挑む!猫と遊ぶためにお茶と水を出し、3回続けてフリックして猫と遊ぶ

インターネット上で話題となったスタンフォード大学のエビ揚げロボットは、1日で人気が急上昇した。結局の...

機械学習の参入障壁が下がり、機械学習エンジニアのポジションがなくなる可能性も

機械学習エンジニアチームの責任者であり、Looker の最高製品責任者でもある彼は、10 年を超える...

AIが建物の快適性に革命を起こす

商業ビルでは、顧客と居住者の快適性がポジティブな体験を保証するために重要です。快適さの重要な要素は、...

「インテリジェント接続」を理解するにはこの記事で十分です!

人類社会は「つながりがない」「弱いつながり」から「賢いつながり」へと徐々に移行しつつあります。グロー...

我が国の独自開発OS micROSがリリースされました!このロボットの「心と脳」は単純ではない

9月10日、2019年世界コンピューター会議が湖南省で開催されました。中国科学院院士の楊学軍氏は、我...

AI時代に需要が高まる6つの仕事

[51CTO.com クイック翻訳] 人工知能によってもたらされる自動化の波が、世界中のさまざまな業...