古い写真の修復、太陽系外惑星の発見... 素晴らしい機械学習プロジェクト 8 つをご紹介します

古い写真の修復、太陽系外惑星の発見... 素晴らしい機械学習プロジェクト 8 つをご紹介します

[[337579]]

カジャル・ヤダブ

マシンハートが編集

編集者: シャオ・ジョウ、ドゥ・ウェイ

人工知能の波の中で、多種多様な機械学習プロジェクトが存在します。代表的かつ実用的なプロジェクトはどれでしょうか? 最近、Kajal Yadav という著者が、実用的で興味深い 8 つの古典的な機械学習プロジェクトをリストしました。現在、Medium で 1.7K 件のいいねを獲得しています。

これら 8 つのプロジェクトのトピックには、感情分析、自動要約生成、感情検出、古い写真の修復、ディープラーニングによる音楽生成などが含まれます。

[[337580]]

カジャル・ヤダブ

ソーシャルメディアに基づくうつ病の分析

[[337581]]

画像ソース: Unsplash、写真提供: dole777。

これは非常にデリケートな問題であり、対処する必要がある緊急の問題であると考えられています。世界中で2億6,400万人以上がうつ病に苦しんでいます。うつ病は、世界中で障害の主な原因の一つであり、世界の疾病負担の大きな部分を占めています。毎年80万人が自殺で亡くなっています。自殺は15歳から29歳までの人々の死亡原因の第2位です。残念なことに、うつ病の治療は遅れたり、不正確であったり、まったく効果がない場合がよくあります。

インターネットベースの生活は、特に若年層におけるうつ病の早期治療サービスを変革する機会を提供します。

ピュー・リサーチ・センターが指摘しているように、72%の人がインターネットを利用しています。ソーシャル ネットワークで公開されるデータセットは、人文科学や脳研究など、多くの分野にとって非常に重要です。しかし、専門家コミュニティからのサポートだけに頼るだけでは不十分であり、明示的な方法論は効果的ではありません。

したがって、ソーシャル メディアの投稿にある象徴的な言語を分析することで、新しいディープラーニング モデルを作成できます。このモデルは、従来の方法よりも早く人々が自分自身の心理状態についての洞察を得るのに役立ちます。

ニューラルネットワークによるスポーツビデオのテキスト要約の生成

[[337582]]

画像出典: Unsplash、撮影: Aksh Yadav。

このプロジェクトのアイデアは、主にスポーツゲームのビデオから正確な要約を抽出することに基づいています。一部のスポーツウェブサイトでは、試合のハイライトを配信しています。抽出テキスト要約のタスクでは、さまざまなモデルが登場していますが、その中でニューラル ネットワークが最高のパフォーマンスを発揮します。一般的に、要約の作成とは、記事の要点を強調しながら事実情報を伝えることに重点を置き、記事の情報を簡単に紹介することを指します。

ゲーム ビデオのアウトラインを自動的に作成すると、ゲームの最高の瞬間やハイライトを見つけるのが難しくなります。そのため、3次元畳み込みネットワーク(3D-CNN)、リカレントニューラルネットワーク(RNN)、長短期記憶ネットワーク(LSTM)などのディープラーニング手法を使用できます。同時に、機械学習アルゴリズムを使用してビデオを複数のセグメントに分割し、サポートベクターマシン(SVM)、ニューラルネットワーク(NN)、k平均法アルゴリズムなどを適用することもできます。

CNN を使用した手書き方程式ソルバー

[[337583]]

画像出典: Unsplash、Antoine Dautry 撮影。

すべての問題の中でも、手書きの数式認識は、コンピューター ビジョン研究の分野における最も難解な問題の 1 つです。画像処理技術を活用した畳み込みニューラル ネットワーク (CNN) の助けを借りて、手書きの数字と数学記号を使用して手書き方程式ソルバーをトレーニングできます。このようなシステムを開発するには、機械が十分に学習して望ましい予測を行えるように、データを使って機械をトレーニングする必要があります。

NLP を使用したビジネス会議の要約の生成

[[337584]]

画像出典: Unsplash、Sebastian Herrmann 撮影。

全員がレポートの内容全体ではなく概要だけを見たいと思っている状況に遭遇したことはありませんか?私たちが学生だった頃、レポートの作成に多くの時間を費やしていましたが、先生たちは要約を読む時間しかありませんでした。

要約は、過剰なデータの問題を解決するための不可欠かつ効果的な方法となっています。会話から情報を抽出することは商業的にも教育的にも大きな価値があり、会話構造から統計的、言語的、感情的な特徴を捉えることで対応できます。

通常、レポートを手動で要約するにはかなりの時間がかかりますが、自然言語処理 (NLP) を使用するとはるかに簡単になります。ディープラーニングでテキスト要約を生成すると、記事全体の文脈を理解できるため、ドキュメントの要約をすばやく生成する必要がある人にとって非常に便利です。

顔認識を使用して感情を検出し、曲を推奨する

[[337585]]

画像出典: Unsplash、Alireza Attari による写真。

人間の顔は人体の重要な部分であり、特に人の心理状態を理解する上で重要です。顔認識を使用して気分を検出し、曲を推奨すると、手動で曲を分類する手間が省けるだけでなく、人の感情特性に基づいて適切なプレイリストを生成するのにも役立ちます。

人々は気分や興味に応じて音楽を聴く傾向があります。そのため、顔の表情を捉え、ユーザーの感情を認識し、それに応じた曲を推奨できるアプリケーションを作成できます。

コンピューター ビジョンは、コンピューターを使用してデジタル画像やビデオを高度に理解することを目的とした学際的な分野です。コンピューター ビジョン コンポーネントを使用すると、顔の表情を通じてユーザーの感情を判断できます。

記事「感動と関心を抱かせる 20 以上の感情認識 API」では、興味深く実用的な 20 以上の感情認識 API を紹介しています。

記事リンク:

https://nordicapis.com/20-emotion-recognition-apis-that-will-leave-you-impressed-and-concerned/

ケプラーなどの宇宙船が撮影した画像から居住可能な太陽系外惑星を見つける

[[337586]]

画像出典: Unsplash、撮影: Nick Owuor。

過去 10 年間で、太陽系を通過する惑星を特定するために 100 万個を超える恒星が監視されてきました。太陽系外惑星候補の手作業による解釈は膨大な作業であり、人為的ミスが発生しやすく、その結果を評価するのは困難です。畳み込みニューラル ネットワークは、ノイズの多い時系列データ内で、最小二乗法よりも高い精度で地球に似た太陽系外惑星を識別するのに適しています。

古い写真の修復

画像出典: Pikist

破損した写真を原始的な方法で復元するのは非常に時間がかかり、面倒です。そのため、ディープラーニングを通じてあらゆる画像の欠陥(ひび割れ、傷、穴など)を見つけることができ、画像復元アルゴリズムの助けを借りて、ピクセル値に基づいて欠陥を簡単に見つけて、古い写真を復元したり、古い写真をカラー化したりすることもできます。

ディープラーニングによる音楽生成

[[337588]]

画像出典: Unsplash、撮影: Abigail Keenan。

音楽は変化する周波数のメロディーです。したがって、自動音楽生成とは、人間による調整を最小限に抑えて短い音楽を作成するプロセスです。最近、ディープラーニング エンジニアリングがプログラムによる音楽生成の最前線になっています。

[この記事は51CTOコラム「Machine Heart」、WeChatパブリックアカウント「Machine Heart(id:almosthuman2014)」によるオリジナル翻訳です]

この著者の他の記事を読むにはここをクリックしてください

<<:  Ascend College Suzhou Technology オープンデーが間もなく開催されます。技術的な知識と実践的な経験が得られます。

>>:  ドイツの中小企業の35%以上がすでに人工知能技術を活用

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

DALL・Eは発売からわずか2日で復刻されたのか?公式論文はまだ発表されていないが、専門家らはすでにそれを再現している。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

人工知能は多くの仕事を置き換えるでしょう。将来の子供たちの競争力は成績とは全く関係ないかもしれません。

[[379145]]昨日、家で強宝と一緒に『様々な職業』という本を読んでいました。突然思いついて、...

人間の髪の毛のわずか200分の1の太さ!科学者たちは脳のように電気を生成できる「ナノワイヤーネットワーク」を構築した

今日の主流の人工知能技術は、ある意味では脳の構造にヒントを得たものです。しかし、コンピュータの計算能...

2021年、AIは小売業者が失われた顧客ロイヤルティを「救う」のに役立つだろう

2020 年は混乱と混乱が共存しましたが、騒動は落ち着き、小売業者は新年に再編成し、新たな常態に向か...

AIが銀行業界にもたらす変化とそれがもたらす課題

銀行は長年にわたり、フロントオフィスとバックオフィスの両方で企業を支援するテクノロジーの活用において...

中国工程院院士の李軍氏:単一車両知能には5つの大きな問題があり、自動運転には新たな技術的ルートが必要

Leifeng.com(公式アカウント:Leifeng.com)注:少し前、2020年世界インテリジ...

推奨アルゴリズムコレクション(パート2) - 相関ルール推奨とKBアルゴリズム

[[331263]] 【51CTO.comオリジナル記事】 1. はじめに前回の記事では、レコメンデ...

...

百度CTO王海鋒氏:「文心易眼」のユーザー数は1億人を超える

「文心易眼のユーザー規模が1億人を突破した」。12月28日、百度の最高技術責任者で、深層学習技術・応...

...

AIの世界は「データ」から「知識」へと移行している

人工知能(AI)革命は半世紀以上前に始まりました。過去 10 年間で、人工知能は学術科学の領域から私...

パフォーマンスが最大480倍向上:Armが2つの新しいAIエッジコンピューティングチップ設計を発表

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

プラスチックチップを1個1セント未満で製造

あなたの周りの物体が知性に満ちていると想像してください。包帯、バナナの皮、ボトルなどはすべて知性を持...