Panda Eats SMS: 機械学習に基づく新しいスパムフィルタリングアプリ

Panda Eats SMS: 機械学習に基づく新しいスパムフィルタリングアプリ

[[212334]]

モバイル インターネット時代に生きる技術オタクとして、私は嫌がらせのテキスト メッセージに悩まされていますが、自分のテキスト メッセージをアップロードせずに済む簡単なフィルタリング アプリケーションは存在しません。そこで私は、テスト期間中に受け取った 20,000 件以上のテキスト メッセージとユーザーから送信されたテキスト メッセージのサンプルから Panda をトレーニングしました。

iOS 11 では、開発者が視覚処理に使用する非常に強力な CoreML 機械学習フレームワークが導入されています。これを使用して、パンダが携帯電話に定着できるようにテキスト分類アプリケーションを作成します。

正確な意味認識

Panda は、大量のサンプルからスパム メッセージのテキスト パターンを学習し、複雑な意味環境のメッセージを非常に正確に分類できます。たとえば、下の図にある [JD Pay] からの 2 つの非常によく似たテキスト メッセージ。

スパムSMSの識別

テキスト メッセージをコピーし、アプリで [精度テスト] をクリックして精度をテストできます。

使い方はとても簡単

インストール後に必要なことは、「設定」→「メッセージ」→「不明なメッセージとフィルターされたメッセージ」を開いて、「パンダがテキストメッセージを食べている」を選択することだけです。パンダは静かにスパムメッセージを食べるのを手伝ってくれます。

プライバシーを重視

Panda はサーバーを必要とせず、インターネット接続も必要ありません。アプリには完全なトレーニング モデルが付属しており、CoreML を使用して携帯電話上のテキスト メッセージを分類できます。 iOS 11 のサンドボックス制限により、SMS フィルターがネットワークにアクセスしたり、メイン アプリとデータを共有したりすることもできなくなります。 iOS 11 では、クラウドベースの判断のためにテキスト メッセージを独自のサーバーに送信するように設定できますが、Panda ではこの機能は使用されません。

自動進化

Panda は急速に成長しており、分類の精度は Panda が以前に同様の情報を見たことがあるかどうかに依存します。でも、世界は広いので、食べたことのないものも必ずあるし、パンダもよく知らないときもある。自発的に、アプリ内で新しい SMS サンプルを送信して Panda に情報を提供することができます。Panda は新しいサンプルから新しい迷惑メールや通常の SMS パターンを学習します。

注: SMS サンプルを送信すると、SMS が匿名でサーバーにアップロードされます。これはローカル トレーニングではありません。Panda はクラウドで学習を完了し、それをすべてのユーザーの携帯電話に配布します。

部分日食について

Panda(教師あり学習)に教えたので、ある程度私の好みを継承しています。割引やプロモーション情報などのあいまいなテキストメッセージはスパムメッセージとしてマークします。しかし、そのような通知を受け取りたい人もいるかもしれません。それはあなた次第です。

システムの制限

iOS 11 のシステム設計により、フィルタリングされたテキスト メッセージには Apple Watch にバッジと通知も表示されます。さらに、iOS 11 では会話に基づいてテキスト メッセージがフィルタリングされます。同じ番号から嫌がらせのテキスト メッセージと通常のテキスト メッセージの両方が送信された場合、会話全体がフィルタリングされます。この現象は 5 桁の番号ではよく見られますが、10 で始まる SMS 送信ポートでは非常にまれです。

***

  • パンダのロゴは、私が大好きなパンダが後ろに転がっている写真から生まれました。
  • Panda は現在中国語のみのトレーニングを受けており、他の言語環境では動作しない可能性があります。

<<:  ディープラーニングで構造化データを処理するにはどうすればよいですか?

>>:  深センの無人バスの試験走行がWeChatモーメンツで話題に!

推薦する

企業はアルゴリズムやデータを通じて、どのようにより深い堀を築くのでしょうか?

[51CTO.com からのオリジナル記事] データは今最もホットなものです。当時は「紙は洛陽と同...

モデルの再現が難しいのは必ずしも作者のせいではない。研究により、モデルの構造に問題があることが判明した。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

将来のモバイル通信ネットワーク、6Gと人工知能の統合

将来の 6G ネットワークのより豊富なビジネス アプリケーションと極めて厳しいパフォーマンス要件を満...

一般的な機械学習アルゴリズムの包括的なリスト

1. 学習方法1.1 教師あり学習1.2 教師なし学習1.3 半教師あり学習1.4 強化学習2. ア...

「ブラックスワン」の翼の下で:情報戦場におけるAIの光と影

[51CTO.comからのオリジナル記事] 突然の流行に直面して、国民は情報の適時性、透明性、伝達効...

安定したビデオ拡散がここにあります、コードウェイトはオンラインです

AI描画で有名なStability AIが、ついにAI生成動画の分野に参入した。今週の火曜日、Sta...

バーチャルアイドル+人工知能+ブロックチェーン、スターを追いかける新しい方法が誕生!

最近、暗号通貨の世界では多くのニュースがありました。BTC は再びフォークを経験し、ビットコインは急...

農業生産性を最適化するスマート農業監視ソリューション

すべての IoT ソリューションの中で、スマート農業システムは間違いなく際立つでしょう。世界経済の中...

...

ByteDanceのLi Hang: 言語ビッグモデルに関するいくつかの観察と考察

この記事は、LLM に関する著者の見解を詳しく説明しています。主なポイントは次のとおりです。 Cha...

AlphaFold: ノーベル賞を受賞する可能性のある最初の AI 成果

「これは、ノーベル賞受賞が期待される最初の人工知能の成果かもしれない。しかし、その画期的な進歩は間違...

2021年のAI展望

人工知能は進歩し続け、企業の運営方法や私たち自身の日常の経験を変えています。実際、AI はほぼすべて...

AIはスマートシティの人材採用に役割を果たすのでしょうか?

AI ツールとテクノロジーはスマート シティと IoT 主導の業界にとってゲームチェンジャーとなっ...