Panda Eats SMS: 機械学習に基づく新しいスパムフィルタリングアプリ

[[212334]]

モバイルインターネット時代に生きる技術オタクとして、私は嫌がらせのテキストメッセージに悩まされていますが、自分のテキストメッセージをアップロードせずに済む簡単なフィルタリングアプリケーションは存在しません。そこで私は、テスト期間中に受け取った 20,000 件以上のテキストメッセージとユーザーから送信されたテキストメッセージのサンプルから Panda をトレーニングしました。

iOS 11 では、開発者が視覚処理に使用する非常に強力な CoreML 機械学習フレームワークが導入されています。これを使用して、パンダが携帯電話に定着できるようにテキスト分類アプリケーションを作成します。

正確な意味認識

Panda は、大量のサンプルからスパムメッセージのテキストパターンを学習し、複雑な意味環境のメッセージを非常に正確に分類できます。たとえば、下の図にある [JD Pay] からの 2 つの非常によく似たテキストメッセージ。

スパムSMSの識別

テキストメッセージをコピーし、アプリで [精度テスト] をクリックして精度をテストできます。

使い方はとても簡単

インストール後に必要なことは、「設定」→「メッセージ」→「不明なメッセージとフィルターされたメッセージ」を開いて、「パンダがテキストメッセージを食べている」を選択することだけです。パンダは静かにスパムメッセージを食べるのを手伝ってくれます。

プライバシーを重視

Panda はサーバーを必要とせず、インターネット接続も必要ありません。アプリには完全なトレーニングモデルが付属しており、CoreML を使用して携帯電話上のテキストメッセージを分類できます。 iOS 11 のサンドボックス制限により、SMS フィルターがネットワークにアクセスしたり、メインアプリとデータを共有したりすることもできなくなります。 iOS 11 では、クラウドベースの判断のためにテキストメッセージを独自のサーバーに送信するように設定できますが、Panda ではこの機能は使用されません。

自動進化

Panda は急速に成長しており、分類の精度は Panda が以前に同様の情報を見たことがあるかどうかに依存します。でも、世界は広いので、食べたことのないものも必ずあるし、パンダもよく知らないときもある。自発的に、アプリ内で新しい SMS サンプルを送信して Panda に情報を提供することができます。Panda は新しいサンプルから新しい迷惑メールや通常の SMS パターンを学習します。

注: SMS サンプルを送信すると、SMS が匿名でサーバーにアップロードされます。これはローカルトレーニングではありません。Panda はクラウドで学習を完了し、それをすべてのユーザーの携帯電話に配布します。

部分日食について

Panda（教師あり学習）に教えたので、ある程度私の好みを継承しています。割引やプロモーション情報などのあいまいなテキストメッセージはスパムメッセージとしてマークします。しかし、そのような通知を受け取りたい人もいるかもしれません。それはあなた次第です。

システムの制限

iOS 11 のシステム設計により、フィルタリングされたテキストメッセージには Apple Watch にバッジと通知も表示されます。さらに、iOS 11 では会話に基づいてテキストメッセージがフィルタリングされます。同じ番号から嫌がらせのテキストメッセージと通常のテキストメッセージの両方が送信された場合、会話全体がフィルタリングされます。この現象は 5 桁の番号ではよく見られますが、10 で始まる SMS 送信ポートでは非常にまれです。

***