AI が「想像」による入力を支援: 携帯電話やコンピューターのソフトキーボードもブラインド入力が可能で、精度は 95% です。

AI が「想像」による入力を支援: 携帯電話やコンピューターのソフトキーボードもブラインド入力が可能で、精度は 95% です。
[[272651]]

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

機械学習を使用すると、ソフトキーボードがなくても入力できます。

なぜ?想像によって。

最近の研究では、韓国科学技術院が、完全に想像力に頼ったキーボード「I-Keyboard」を提案しました。このインターフェースでは、ソフトキーボード上の文字のレイアウト、形状、サイズは確認できません。

機械学習技術を使用することで、タッチスクリーンのどの領域からでも高い精度で入力できます。

研究者らは、この新しいタッチタイピングキーボードにより、ほとんどの人が従来の仮想キーボードと比較して 95.84% の精度を達成できると主張しています。

[[272652]]

ビルドシステム

このシステムを構築する最初のステップは、人間がソフトキーボードに入力することなく、タッチ位置のデータセットを見つけることです。

研究者らは、QWERTYキーボードを頻繁に使用するボランティア43人を募集し、彼らのデータを用いてデータセットを構築した。いわゆる QWERTY キーボードは、通常のコンピューターや携帯電話の 26 キー入力方式の文字レイアウトです。

ボランティアは研究者の指示に従って、Twitter と 20 のニュースデータセットからランダムに選択された 150~160 の文章を含むいくつかの定型文を入力する必要があり、正式な開始前に 15 の文章でウォーミングアップが行われました。

最終的に、各参加者は約 15 分かけて合計 7,245 個のフレーズと 196,194 回のキーストロークを入力しました。

論文で紹介されている携帯電話機器は以下のとおりです。

△ データ収集装置

画面には特定の入力指示が表示されます (図 a)。このプロセス中は、Delete キーと Enter キー以外のプロンプトは画面に表示されません。暗い入力インターフェイスは次のようになります (図 b)。

研究者らは位置情報を収集した後、データを正規化し、位置のオフセットを除去しました。

研究者たちは、ボランティアが「ブラインドタイピング」をする際に識別した文字の配置は水平に並んでいるのではなく、特定の分布曲線を描いていることを発見した。

△アルゴリズム「脳サプリ」のキーボード配布

そこで、これらの調査を行った後、研究者らは 3 つのモジュールで構成される I-Keyboard のシステム アーキテクチャを設計しました。

ユーザーインタラクションモジュール、準備モジュール、および通信層。

まず、システムはタッチ スクリーンまたはタッチ インターフェイスを通じて入力を受け取ります。

一方、データ準備モジュールは情報を前処理し、生の入力をフォーマットします。

最後に、機械学習フレームワークとアプリケーション フレームワークを緊密に統合する通信層が情報を処理し、ディープ ニューラル デコーダー (DND) が入力情報を文字列に変換し、タイピストが入力する内容を予測する役割を担います。

△ I-Keyboard システムアーキテクチャ図

展開システム

システムの構築後、研究者らは MacBook Pro に I-Keyboard を導入し、システムのパフォーマンスをテストしました。

研究者たちはフレーズセットからランダムに20のフレーズを選択し、参加者に1分あたり45.47語の速度で入力するよう依頼しました。

この入力速度は固定ではありません。研究者は、物理キーボードやソフトキーボードを使用する場合、各人の入力速度が異なることを考慮しました。そのため、テストの品質を確保するために、テスターは物理キーボードを使用して 88.74% の速度で入力することもできます。

結果は、この方法の精度が 95.84% に達し、ベースライン レベルを 4.06% 上回ったことを示しました。

研究者らによると、I-Keyboardは現在すべてのスマートフォンのモデルをサポートしているわけではないが、研究者らの目標はシステムをすべてのタッチスクリーンデバイスに拡張することだという。

このような研究には無限の将来性があり、ジェスチャー認識アルゴリズムを追加することで、ひげや句読点、ファンクションキーなど、アルファベット以外の文字の入力も実現できると研究者らは述べた。

つまり、まったく新しい入力体験です。

ポータル

VentureBeat のレポート:

https://venturebeat.com/2019/08/02/ai-may-turn-touchscreen-keyboards-invisible/

論文の宛先:

https://arxiv.org/abs/1907.13285

<<:  AIの旅を始めるのに役立つ3つの重要なステップ

>>:  テンセントAIは、人間が1日で440年分に相当するトレーニング量で、すべて独学でキング・オブ・グローリーのプロチームを破った。

ブログ    

推薦する

人工知能はビジネス開発にどのような影響を与えるのでしょうか?

[[403654]]人工知能はイノベーションを推進し、ビジネス開発を変えています。人工知能と機械学...

クラウドコンピューティングと人工知能が伝統的な医学を覆すのは時間の問題だ

2016年1月、国家衛生計画出産委員会は専門医向けの「5+3+x」標準化研修システムを発行しました。...

...

...

食べられる「論理ゲート」:科学者たちはデザートを「ミニコンピューター」に変えた

過去 10 年間で、食品業界では 3D プリント食品、食用センサー、ロボット調理、AR ダイニングな...

AIとデータが未来のスマートシティを強化する5つの方法

私たちが住む世界はますます都市化が進んでいます。 2009 年の国連の調査によると、毎週 130 万...

RPAが企業にもたらすメリットトップ10

この記事では、RPA がビジネスの効率と生産性を向上させる 10 の方法について詳しく説明します。 ...

2022年のNature年次指数が発表され、最も急成長した50の機関のうち31は中国の機関です。

​たった今、2022年のNature年次インデックスレポートが発表されました。上位50の研究機関のう...

RustベースのZedエディタがオープンソース化され、OpenAIとGitHub Copilotのサポートが組み込まれました

ティム・アンダーソンノアが編集制作:51CTO テクノロジースタック(WeChat ID:blog)...

ロボティック プロセス オートメーションとスマート データ センターの未来

多くの人がロボットについて考えるとき、金属製のヒューマノイド、あるいはテレビ番組で互いに競い合うイン...

プライバシー保護における新たなブレークスルー: ガウス差分プライバシー フレームワークとディープラーニングの組み合わせ

[[324532]]人工知能におけるプライバシーの問題は、重要かつ深刻な問題として認識されています。...

Google の Bard チャットボットがアップデートされ、リアルタイムで応答を生成できるようになりました

10 月 29 日現在、大規模言語モデル (LLM) では即座に回答を出すことができないため、質問を...

プライバシー保護を再構築するには、AIモデルに「あなたを忘れさせる」ことを早く行う必要がある

この時代において、プライバシーは長い間誤った主張となってきました。プライバシー保護をある程度回復する...

人間と機械の統合はなぜ難しいのでしょうか?

時間と空間を結びつけるのは速度であり、エネルギーと質量を結びつけるのも速度です。事実と価値を結びつけ...

...