庚子の年に流行したAIアプリのレビュー

庚子の年に流行したAIアプリのレビュー

2020年にはAIがより広く活用されるようになるでしょう。最先端の新興産業を開拓すると同時に、伝統的な産業にも浸透し、変革に貢献するでしょう。 AIは急速に成長し、私たちの生活に欠かせないものになりつつあり、AIはほぼ誰もが知る名前になりました。

新年を迎え、新たな章が始まるにあたり、過去 1 年間の AI の成果と開発動向を振り返ってみましょう。

AI は私たちを時空を超えて連れて行ってくれます。今年、人工知能分野で最も注目されているプロジェクトの 1 つは、Weibo ブロガーの @大谷 Spitzer が AI を使用して歴史的なビデオや肖像画を復元したプロジェクトです。

まず、今年5月に、彼はDAIN補間アルゴリズム、ESRGAN、DeOldifyなどのAI技術を使用して、100年前の古い北京の白黒ビデオをカラー化し、フレームレートと超解像度を復元し、人々がタイムトラベルして100年前の北京の街の風景を体験できるようにしました。

その後も彼は歴史上の人物の肖像画の「修復」を続けた。 12月にはAIを使って宋、明、清の皇帝の肖像画を作成し、WeChatモーメンツで再び人気を博した。 PaddleGAN、AI Studio、Artbreeder、そして中国科学院が開発した顔認識技術SeetaFaceは、いずれもこれらの頭脳を必要とするタスクに貢献しています。

将来的には、これらのテクノロジーは、映画やテレビ、芸術創作、歴史や文化のコミュニケーションにおいても、より大きな価値を実現するでしょう。

AIが中華民国の北京の街並みのビデオを復元、インターネットで話題に、過去へ連れて行ってくれる

[[383130]]

AIが宋、明、清の皇帝の姿を想像し、4人のモデルが実際の顔の特徴を思い描く

[[383131]]

ロボットを使って犬に命令する
さまざまな種類の犬が、捜索救助、ナビゲーション、運搬、交友、追い払い、警備、家の取り壊しなど、社会における複雑な任務を遂行することができます。では、彼らはロボットの指示を理解して従うことができるのでしょうか?

イェール大学ソーシャルロボティクス研究所は最近、IEEE の Spectrum に新しい研究を発表しました。実験では、ロボットが犬を撫でるために出した命令の方が、人間が犬を撫でるために出した命令よりも犬が従う傾向がありました (奇妙な知識ポイントが追加されました.jpg)。

イェール大学の新しい研究がIEEEに掲載:犬はロボットの命令に従う可能性が高い

[[383132]]

論文の宛先:

https://spectrum.ieee.org/automaton/robotics/robotics-software/dogs-obey-commands-given-by-social-robots

モザイクが数秒でHDに変わる
「モザイク」ピクセルレベルのヘッドショットを高解像度の写真に変換するとどうなるでしょうか?

デューク大学の研究者たちはAIアルゴリズムを使って答えを出しました。彼らが提案したアルゴリズムは、PULSE (Photo Upsampling via Latent Space Exploration) と呼ばれます。

このアルゴリズムは、ぼやけて認識できない顔の画像を、目に見える髪の毛や目尻のしわのレベルに至るまで、これまでよりも細かくリアルな詳細を持つコンピューター生成画像に変換することができます。 PULSE の想像力があれば、感動的な画質に別れを告げることも夢ではありません。

デューク大学は、低品質のモザイクを保存し、数秒で高解像度の画像に変換するAIアルゴリズムを提案しています。

[[383133]]

論文の宛先:

出典: http://arxiv.org/pdf/2003.03808.pdf

機械学習が物理学の不合格リスクを予測
新年が過ぎ、期末試験の結果が出ました。多くの学生は、困惑している物理学の授業に無事合格できるでしょうか?機械学習は実際に事前に予測することができます。

今年8月、ウェストバージニア大学とカリフォルニア工科大学の学者らがarxiv.orgに「機械学習を使用して物理学の授業で最もリスクの高い生徒を特定する」と題する研究を発表し、機械学習アルゴリズムを通じて、基礎物理学の授業を受けた生徒の卒業成績を授業や宿題の成績に基づいて評価できると提案した。

しかし、恥ずかしいことに、その予測精度はランダムな確率とほぼ同じで、わずか57%です...つまり、試験に不合格になるかどうかは、自分の感覚次第です!

期末試験はまだ終わっていないが、アルゴリズムによれば、私は間違いなく大学の物理学のコースで不合格になるだろう

論文の宛先:

https://arxiv.org/abs/2007.13575

5分で顔を変えて神聖な歌を歌おう
以前、小破局の熟練したUpマスターたちは、「一次モーションモデル」のAI顔面変更プロジェクトを利用して、独特なスタイルのさまざまなビデオを生成しました。

ジャッキー・チュン、杜甫、唐僧、パンダ頭絵文字が「ダメダネ」と「Unravel」を感動的に歌います...

Bステーションの神聖な歌「ダメダネ」:本質は顔を変えること、5分で学べる

[[383134]]

この顔を変えるツールを使えば、絵画の中の人物であっても、どんなキャラクターにもどんな表情も与えることができます。さらに、このモデルはオープンソースなので誰でも利用できます。5 分で習得できます。チュートリアルはこちらです:

https://openbayes.com/console/openbayes/public/containers/BwZQj5wr3Jp

論文の宛先:

出典: http://arxiv.org/pdf/2003.00196.pdf

オリジナルプロジェクトのGithubアドレス:

https://github.com/AliaksandrSiarohin/ファーストオーダーモデル

アルコール中毒を検知するスマートフォン
皆さんご存知のとおり、飲酒運転はしないでください。また、飲酒後に運転しないでください。しかし、自分自身をコントロールできない人もいます。

ピッツバーグ大学医学部の主任研究員であるブライアン・サフォレット氏は、熟練したドライバーが飲酒運転をしているかどうかを検知するために、スマートフォンを使って飲酒しているかどうかを検知する方法を論文「スマートフォンの加速度計を使用してアルコール中毒による歩行障害を検知する予備研究」で紹介した。被験者はスマートフォンを携帯し、2ステップのステップを踏むだけで呼気中のアルコール濃度を検知できます。

酔っているかどうかは、スマホを持って散歩すれば分かります。

[[383135]]

<<:  2021年の人工知能の注目分野

>>:  将来、運転手や運転免許証は必要なくなるのでしょうか?自動運転車はどれくらい遠いのでしょうか?

ブログ    

推薦する

...

XiaoIceが11人のAI歌手を一気にリリース:プロの歌手に匹敵するにはたった45日間のトレーニングが必要

11月25日、 XiaoIceフレームワークは11人のAI歌手をリリースし、アシスタント、同僚、親戚...

AIはあなたの建物をスマートで健康的な建物にします

すぐにスマートで健康的な建物で仕事に戻り、スマートフォンのアプリを使ってハンズフリーでドアを開けるこ...

ニューラル ネットワークを構築する超簡単な方法、あなたにもできます!

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

...

ドローンが田舎に飛来、その価値は想像もできない

現在、技術の継続的な進歩と産業発展の継続的な加速により、エンターテインメント、輸送、救助などの分野で...

OpenAIは人間の参照要約よりも優れており、人間のフィードバックを利用して要約生成の品質を向上させています。

言語モデルがより強力になるにつれて、特定のタスクのデータとメトリックがトレーニングと評価のボトルネッ...

人工知能センターオブエクセレンス:ビジネス変革を推進する新たなエンジン

AIセンターオブエクセレンスは、人材の統合、プラットフォームの標準化、ビジネス領域全体への成果の普及...

...

...

トランスフォーマー+強化学習、Google DeepMindは世界を知覚するロボットの脳となる大きなモデルを作る

ロボットの学習方法を開発する際に、大規模で多様なデータセットを統合し、強力で表現力豊かなモデル (T...

AIテキスト翻訳システムの品質が44%向上し、500億以上のパラメータを使用して200の言語を翻訳

Meta Platforms は本日、Meta が社内開発した、200 言語のテキストを翻訳できる人...

LLM-Blender: 大規模な言語モデルも学習に統合可能

最近、arxiv を見ていたときに、Ensemble メソッドを使用して大規模な言語モデルを統合でき...

C# のデータ構造とアルゴリズムにおけるツリーの役割を紹介します

C# データ構造とアルゴリズムツリーまず、Windows でコマンド ラインに「tree」と入力しま...