Panda Eats SMS: 機械学習に基づく新しいスパムフィルタリングアプリ

Panda Eats SMS: 機械学習に基づく新しいスパムフィルタリングアプリ

[[212334]]

モバイル インターネット時代に生きる技術オタクとして、私は嫌がらせのテキスト メッセージに悩まされていますが、自分のテキスト メッセージをアップロードせずに済む簡単なフィルタリング アプリケーションは存在しません。そこで私は、テスト期間中に受け取った 20,000 件以上のテキスト メッセージとユーザーから送信されたテキスト メッセージのサンプルから Panda をトレーニングしました。

iOS 11 では、開発者が視覚処理に使用する非常に強力な CoreML 機械学習フレームワークが導入されています。これを使用して、パンダが携帯電話に定着できるようにテキスト分類アプリケーションを作成します。

正確な意味認識

Panda は、大量のサンプルからスパム メッセージのテキスト パターンを学習し、複雑な意味環境のメッセージを非常に正確に分類できます。たとえば、下の図にある [JD Pay] からの 2 つの非常によく似たテキスト メッセージ。

スパムSMSの識別

テキスト メッセージをコピーし、アプリで [精度テスト] をクリックして精度をテストできます。

使い方はとても簡単

インストール後に必要なことは、「設定」→「メッセージ」→「不明なメッセージとフィルターされたメッセージ」を開いて、「パンダがテキストメッセージを食べている」を選択することだけです。パンダは静かにスパムメッセージを食べるのを手伝ってくれます。

プライバシーを重視

Panda はサーバーを必要とせず、インターネット接続も必要ありません。アプリには完全なトレーニング モデルが付属しており、CoreML を使用して携帯電話上のテキスト メッセージを分類できます。 iOS 11 のサンドボックス制限により、SMS フィルターがネットワークにアクセスしたり、メイン アプリとデータを共有したりすることもできなくなります。 iOS 11 では、クラウドベースの判断のためにテキスト メッセージを独自のサーバーに送信するように設定できますが、Panda ではこの機能は使用されません。

自動進化

Panda は急速に成長しており、分類の精度は Panda が以前に同様の情報を見たことがあるかどうかに依存します。でも、世界は広いので、食べたことのないものも必ずあるし、パンダもよく知らないときもある。自発的に、アプリ内で新しい SMS サンプルを送信して Panda に情報を提供することができます。Panda は新しいサンプルから新しい迷惑メールや通常の SMS パターンを学習します。

注: SMS サンプルを送信すると、SMS が匿名でサーバーにアップロードされます。これはローカル トレーニングではありません。Panda はクラウドで学習を完了し、それをすべてのユーザーの携帯電話に配布します。

部分日食について

Panda(教師あり学習)に教えたので、ある程度私の好みを継承しています。割引やプロモーション情報などのあいまいなテキストメッセージはスパムメッセージとしてマークします。しかし、そのような通知を受け取りたい人もいるかもしれません。それはあなた次第です。

システムの制限

iOS 11 のシステム設計により、フィルタリングされたテキスト メッセージには Apple Watch にバッジと通知も表示されます。さらに、iOS 11 では会話に基づいてテキスト メッセージがフィルタリングされます。同じ番号から嫌がらせのテキスト メッセージと通常のテキスト メッセージの両方が送信された場合、会話全体がフィルタリングされます。この現象は 5 桁の番号ではよく見られますが、10 で始まる SMS 送信ポートでは非常にまれです。

***

  • パンダのロゴは、私が大好きなパンダが後ろに転がっている写真から生まれました。
  • Panda は現在中国語のみのトレーニングを受けており、他の言語環境では動作しない可能性があります。

<<:  ディープラーニングで構造化データを処理するにはどうすればよいですか?

>>:  深センの無人バスの試験走行がWeChatモーメンツで話題に!

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

2 要素認証 (2FA) とは何ですか? また、なぜ使用する必要があるのですか?

インターネットは、ミームや動画、秘密にしておきたいものの宝庫です。セキュリティは最も重要です。正直に...

Yixue EducationのCui Wei氏:将来、教育分野での授業はロボットに置き換えられるでしょう

[原文は51CTO.comより] 教育業界と人工知能が出会うと、どんな火花が散るでしょうか?国内外の...

...

分散型コンセンサスアルゴリズム: 想像以上に複雑

1. 分散システムの難しさ張大鵬は難しい問題に遭遇した。彼らの会社には貴重なデータを保存しているサー...

...

これまで見たことのないアルゴリズムのダンス(ビデオ)

[[21488]]サピエンティア大学の以下のビデオをご覧ください。学生たちが中央ヨーロッパの民族舞...

いくつかの単純な負荷分散アルゴリズムとそのJavaコード実装

1. 負荷分散とは何ですか?負荷分散(英語名は Load Balance)とは、複数のサーバーを対称...

2024年に最も使用される11のAIテキスト生成ツール

世界は、スーパーヒーローのマントを身につけていない強力な世界的勢力のような人工知能 (AI) が支配...

TensorFlow の基礎から実践まで: 交通標識分類ニューラル ネットワークの作成方法を段階的に学習します

[[198754]] TensorFlow は、最も人気のあるディープラーニングフレームワークになり...

洪水の知らせを聞いたらすぐに行動を起こしましょう!ロボットは風と波の守護者となることを目指す

災害に直面して、すべての関係者が行動を起こした。人民解放軍部隊が被災者の救出に派遣されているとみられ...

人工ニューラル ネットワークのドライバー: 活性化関数とは何ですか?

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...

...

AIネットワークはこれまで考えられていたよりも攻撃に対して脆弱である

人工知能 (AI) ツールは、自動運転車から医療画像解釈まで、さまざまなアプリケーションで使用される...

人工知能と機械学習における13の共通概念

[[422893]] 01 人工知能アラン・チューリングは人工知能を次のように定義しました。カーテン...