Panda Eats SMS: 機械学習に基づく新しいスパムフィルタリングアプリ

Panda Eats SMS: 機械学習に基づく新しいスパムフィルタリングアプリ

[[212334]]

モバイル インターネット時代に生きる技術オタクとして、私は嫌がらせのテキスト メッセージに悩まされていますが、自分のテキスト メッセージをアップロードせずに済む簡単なフィルタリング アプリケーションは存在しません。そこで私は、テスト期間中に受け取った 20,000 件以上のテキスト メッセージとユーザーから送信されたテキスト メッセージのサンプルから Panda をトレーニングしました。

iOS 11 では、開発者が視覚処理に使用する非常に強力な CoreML 機械学習フレームワークが導入されています。これを使用して、パンダが携帯電話に定着できるようにテキスト分類アプリケーションを作成します。

正確な意味認識

Panda は、大量のサンプルからスパム メッセージのテキスト パターンを学習し、複雑な意味環境のメッセージを非常に正確に分類できます。たとえば、下の図にある [JD Pay] からの 2 つの非常によく似たテキスト メッセージ。

スパムSMSの識別

テキスト メッセージをコピーし、アプリで [精度テスト] をクリックして精度をテストできます。

使い方はとても簡単

インストール後に必要なことは、「設定」→「メッセージ」→「不明なメッセージとフィルターされたメッセージ」を開いて、「パンダがテキストメッセージを食べている」を選択することだけです。パンダは静かにスパムメッセージを食べるのを手伝ってくれます。

プライバシーを重視

Panda はサーバーを必要とせず、インターネット接続も必要ありません。アプリには完全なトレーニング モデルが付属しており、CoreML を使用して携帯電話上のテキスト メッセージを分類できます。 iOS 11 のサンドボックス制限により、SMS フィルターがネットワークにアクセスしたり、メイン アプリとデータを共有したりすることもできなくなります。 iOS 11 では、クラウドベースの判断のためにテキスト メッセージを独自のサーバーに送信するように設定できますが、Panda ではこの機能は使用されません。

自動進化

Panda は急速に成長しており、分類の精度は Panda が以前に同様の情報を見たことがあるかどうかに依存します。でも、世界は広いので、食べたことのないものも必ずあるし、パンダもよく知らないときもある。自発的に、アプリ内で新しい SMS サンプルを送信して Panda に情報を提供することができます。Panda は新しいサンプルから新しい迷惑メールや通常の SMS パターンを学習します。

注: SMS サンプルを送信すると、SMS が匿名でサーバーにアップロードされます。これはローカル トレーニングではありません。Panda はクラウドで学習を完了し、それをすべてのユーザーの携帯電話に配布します。

部分日食について

Panda(教師あり学習)に教えたので、ある程度私の好みを継承しています。割引やプロモーション情報などのあいまいなテキストメッセージはスパムメッセージとしてマークします。しかし、そのような通知を受け取りたい人もいるかもしれません。それはあなた次第です。

システムの制限

iOS 11 のシステム設計により、フィルタリングされたテキスト メッセージには Apple Watch にバッジと通知も表示されます。さらに、iOS 11 では会話に基づいてテキスト メッセージがフィルタリングされます。同じ番号から嫌がらせのテキスト メッセージと通常のテキスト メッセージの両方が送信された場合、会話全体がフィルタリングされます。この現象は 5 桁の番号ではよく見られますが、10 で始まる SMS 送信ポートでは非常にまれです。

***

  • パンダのロゴは、私が大好きなパンダが後ろに転がっている写真から生まれました。
  • Panda は現在中国語のみのトレーニングを受けており、他の言語環境では動作しない可能性があります。

<<:  ディープラーニングで構造化データを処理するにはどうすればよいですか?

>>:  深センの無人バスの試験走行がWeChatモーメンツで話題に!

ブログ    
ブログ    

推薦する

秘密裏に利用規約を変更したことで、Software Freedom Conservancy が激怒しました。オープンソースコミュニティがZoomの放棄を呼び掛け

パンデミックの間、リモートワークは必須となり、多くのビデオ会議ツールが普及しました。 Zoom は最...

マイクロソフトが新しいハイブリッド会議機能をリリース: Teams Rooms、リモート プレゼンテーション カメオ、Viva Connections モバイル アプリ

IT Homeは9月10日、マイクロソフトが、オフラインの会議室に中央制御のオーディオデバイスを設置...

5G無人配送車両が北京に登場、現在試験運用中

最近、北京市自転車・電動自動車産業協会が主催した「第一回ターミナル配送インテリジェント交通サミットフ...

注目すべきAIハードウェアスタートアップ3社

AI は本質的にはソフトウェアの追求ですが、ハードウェア エンジニアに多くの機会を生み出し、多くのス...

量子化学計算と機械学習に基づいて、肉眼で検出可能な蛍光分子をゼロから作成する

蛍光分子を設計するには、分子の光吸収など、分子構造に直接関連するものだけでなく、相互に関連する複数の...

...

Mambaはこのように使用できます。バイトをトークンに分割せずに効率的に学習します。

言語モデルを定義するときは通常、基本的な単語分割方法を使用して文を単語、サブワード、または文字に分割...

...

自動運転制御プロセスにおいて解決すべき規制上の問題は何ですか?

自動運転車は自動車の知能化の究極の目標であると広く考えられていますが、自動車技術のさまざまな段階の発...

2021年の人工知能分野の技術開発の概要

本稿では、海外の人工知能分野の科学技術発展の現状を調査し、その発展動向を判断するために、2021年の...

アリババのロボットが200語のエッセイを修正し、8つの間違いを発見

最近、浙江外国語大学国際学院で、アリババAIが試験の採点を完了し、200語のエッセイに8つの誤りを発...

「アルゴリズムとデータ構造」時間と空間の複雑さ

[[361000]]この記事はWeChatの公開アカウント「Unorthodox Front-en...

スループットが約30倍に増加しました。田元東チームの最新論文は、大規模モデル展開の問題を解決している

大規模言語モデル (LLM) は今年非常に人気がありました。しかし、その驚異的な効果の背後には、巨大...

GPT-4Vの自動運転への応用の見通しは?現実世界のシナリオの包括的な評価はここにあります

GPT-4V のリリースにより、多くのコンピューター ビジョン (CV) アプリケーションに新たな可...

オンラインクレジットは消費者保護において「難しい問題」でしょうか? AIアプリケーションは消費者の権利を保護する

何億人ものインターネットユーザーの一人として、クレジット取引を処理するためにオフラインの営業所に行く...