2020年、アルゴリズムの話題が主流になる年

2020年、アルゴリズムの話題が主流になる年

[[397576]]

システムに閉じ込められた配達員から人々が飽きることのないソーシャルメディアまで、2020年には、アルゴリズムに関する議論がようやく主流の議論に入りました。

これはほんの始まりに過ぎません。データが生活のあらゆる場所に根付くにつれ、10 秒の短いビデオの選択から刑事事件の裁判まで、アルゴリズムの適用範囲はますます広がっています。しかし、アルゴリズムは具体的にどのように形成されるのか、それは私たちの行動にどのような影響を与えるのか、そしてそれに応じて社会生活にどのような変化をもたらすのか...これらのブラックボックスのような問題に直面して、多くの人々はまだそれを理解しておらず、疑問さえ持っていないかもしれません

一般的に言えば、アルゴリズムの形成には、トレーニング データの収集と、アルゴリズムの設計、トレーニング、および適用という 2 つの部分が主に含まれます。本論文では、これら2つの部分に関する2020年の主な出来事をまとめ、関連分野の専門家と実務家3名にインタビューし、アルゴリズムが私たちの生活に与える影響について彼らがどのように認識しているかを聞きました。

アルゴリズムはデータなしでは機能しないが、データがあるところには漏洩がある

アルゴリズムの形成はトレーニング データと切り離せません。前の図に示すように、アルゴリズムを実装してモデルを構築する前に、大量のデータを収集する必要があります。

これらのデータは、承認されたアプリによって収集された ID データ、アプリの使用によって生成された行動データ、さらには宅配便やホテル滞在中に記録されたデータなど、私たちの生活のあらゆる側面から得られます。

我々は透明なプライバシーの時代に入った」と上海交通大学データ法研究センターの執行ディレクター、何元氏はザ・ペーパーとのインタビューで語った。 「インターネットはあなた自身よりもあなたのことをよく知っています…これらの企業は、私たちが望むと望まざるとにかかわらず、すでに私たちのデータを持っています。」


これは、ユーザーが無力であることを意味するものではありません。たとえば、不明なソースからのアプリの使用を避けたり、個人情報を取得するアプリを簡単に許可しないようにしたりすることができます。

しかし、その前に、明確にする必要がある 2 つの質問があります。

まず、個人情報と個人のプライバシーは同じ概念ではありません。プライバシーとは、誰もが譲ることのできない個人情報です。もしこの情報の取引が許可されれば、私たちはもはや完全な人間ではなくなるでしょう。

一方、個人情報は、本人確認に重点を置いています。これらの情報を組み合わせることで、個人を特定することができます。

第二に、権利と義務は平等です。ユーザーがモバイル アプリケーションを無料で使用する場合、一部の個人情報を提供し、ターゲット広告を受け入れることになります。広告主はモバイル アプリケーションに料金を支払います。これが現在の無料インターネット モデルです。

「法律は個人情報の権利を完全に保護しているわけではない」と何元氏は説明した。

しかし、関連システムが徐々に改善されれば、一般データ保護規則(GDPR)などの法令に基づく集団訴訟や公益訴訟、高額の罰金など、国民が個人情報の安全を守る手段は増えるだろう。ただし「大企業にとって、より恐れているのは賠償ではなく、ブランドの失墜だ」という。

テクノロジーは中立的ですよね?

アルゴリズムは私たちの生活に大きな利便性をもたらす一方で、大きな論争も引き起こしてきました。そのため、人々はこの古典的な問題について再び議論し始めました。「テクノロジーは中立か?」

「私は常に、テクノロジー自体は中立的であると信じています。テクノロジーが作られたとき、それは単に技術的な問題を解決するためでした」と、上級インターネットソフトウェアエンジニアのジャスティン氏はザ・ペーパー紙のインタビューで語った。「将来がどうなるかということについては、テクノロジーが開発中に考慮するものではありません。」

しかし、さまざまな意見があります。

いわゆる『中立的』なものは、特に人工製品の場合、実際には何らかの機能的方向性があらかじめ決められている」と復旦大学哲学学院の徐英金教授は例を挙げて述べた。「例えば、銃剣は野菜を切るのに絶対に適していない。その機能的方向性は野菜を切ることではないからだ。」

中立的であるかどうかは別として、アルゴリズムに関連する物議を醸す出来事は、特にCOVID-19パンデミックの文脈において、私たちの目にますます多くなってきました。

例えば、イギリス政府は、流行病の影響で大学入試が実施できない問題を解決するために、アルゴリズムを使って学生の成績を評価することを決定しましたが、アルゴリズムによって評価された学生の成績については多くの論争がありました。そのうち、イングランドの受験者の約40%は、少なくとも1段階スコアが下がった。 2020年8月25日、英国の試験規制当局のディレクターであるサリー・コリアー氏が辞任を発表した。

また、2020年3月には、一部のネットユーザーから、健康コードが不可解に赤くなっていると指摘された。あるネットユーザーは知书にこう書き込んだ。「旅程全体は正常で、感染者や感染疑い者との接触はなく、流行地域にも行っていなかった。しかし、健康コードがどういうわけか赤に変わったため、その日は泊まる場所がなく、路上で一夜を過ごした」

これらのアルゴリズムは私たちの日常生活に密接に関係しているが、その背後にある動作ロジックを理解している人はほとんどいない。「これが強力な技術的および知識的障壁を生み出し、このようなシステムを国民が監視するのに役立たない...それはある種の力の不均衡感を生み出している」と徐英金氏は説明した。


しかし、これらの論争の原因をアルゴリズムだけに限定すべきではない。前述したように、アルゴリズムの形成は、人々の過去の行動である大量のトレーニングデータと切り離せません。

2020年2月のVOXの記事には、「コンピューターは大量のデータにさらされると、データ内の繰り返しパターンを検出し、これらのパターンに基づいて独自の判断、評価、予測のロジックを形成する」と書かれている。つまり、アルゴリズムの使用は社会における差別や偏見を増幅させるだろう。

例えば、メルボルン大学が2020年12月に発表した研究では、人工知能採用ソフトウェアにおける性差別は、採用担当者自身の潜在意識による差別に起因している可能性があることが示されました。研究者らは40人の採用担当者に同一の履歴書を配布したが、性別が明記されているものもあれば、性別が削除されているものもあった。結果は、男性と女性の応募者が同じ能力と経験を持っていたにもかかわらず、採用担当者は男性に高いスコアを与えたことを示した。履歴書に性別が記載されていない場合でも、採用担当者は男性を好みます。

VOXの記事は、さまざまなアルゴリズムの背後にあるブラックボックスを説明することが、こうした偏見論争を解消するための第一歩であると主張している。一部の学者は、アルゴリズムのユーザーは少なくともトレーニング データ、検証データ、テスト データの人口統計学的特性を公開する必要があると考えています。

徐英金氏は、アルゴリズムをトレーニングする際、研究者はデータを単に繰り返すのではなく、常に新しい知識を吸収し、関連する理解と予測を手動で修正する必要があると示唆した。 「なぜなら、将来起こることは過去に起こったことと似ているだろうと私たちに言う哲学的な理由はないからです。」

そして「人」の役割は非常に重要です。たとえば、ジャスティン氏は、推奨アルゴリズムの弱点の 1 つは「機械の目標は通常は非常に明確ですが、私たちが学習したいことは定量化できないことが多い」ことだと考えています。そのため、現在では多くのコンテンツ プラットフォームで、機械による推奨以外の戦略が取り入れられています。

いずれにせよ、アルゴリズムを修正するまでの道のりは長いものとなるでしょう。結局のところ、アルゴリズム開発の最大の原動力は企業の利益であることが多く、人間の弱点は一夜にして変えることはできません。

しかし、アルゴリズムの問​​題がようやく主流の議題に入ったという事実は、私たちの社会にとって大きな一歩です。

<<:  3つのステップで声紋システムを構築する方法

>>:  企業はどのように人工知能を導入し、そこから価値を得ることができるのでしょうか?

ブログ    

推薦する

大規模モデルは16,000以上の実世界のAPIを習得しており、清華大学などのToolLLMのツール使用能力はChatGPTに劣らない。

ご存知のとおり、オープンソースの大規模言語モデル (LLM) とその派生モデル (LLaMA や V...

...

ユニバーサルミッション!清華大学、線形複雑性を実現するバックボーンネットワークFlowformerを提案|ICML2022

タスクの一般性は、基本モデル研究の中心的な目標の 1 つであり、ディープラーニング研究が高度なインテ...

マイクロソフト、Windows 11、Bing、Edge などで統合された Copilot AI アシスタントをリリース

Microsoft は、生成型人工知能ベースのデジタル アシスタント Copilot をより多くのソ...

「段階的に考える」だけでは不十分です。モデルを「より多くのステップで考える」ようにすれば、より有用になります。

今日では、大規模言語モデル (LLM) とその高度なヒント戦略の出現により、特に古典的な NLP タ...

Baidu Apollo、新たなスマート運転体験を提供するためXiaodu Assistantをリリース

自動車のインテリジェンスの急速な発展に伴い、新たなスマートな運転体験を実現し、スマートな移動を再定義...

機械学習はビジネスシナリオにどのように適用されますか? 3つの実際のビジネスプロジェクト

国府如和の長年にわたる指導過程において、多くの学生が次のような質問をしました。機械学習は実際のビジネ...

画像とテキストの認識 - 人工知能の知恵

序文人間が世界を認識する際の約 80% は視覚によって行われます。そのため、コンピューターが人間の視...

...

プライベートUNIT学習ノート - 対話システムの構築を簡単に始めることができます

対話システムの構築は比較的専門的で複雑なプロセスであり、通常は 3 つの主要な段階に分かれています。...

HTTPS の脆弱性が再び明らかに、企業は SSL/TLS 暗号化アルゴリズムをアップグレードする必要がある

CBC および RC4 暗号化アルゴリズムが相次いで「衰退」しているため、SSL/TLS に依存して...

AIが医薬品開発において適切な医薬品成分の特定にどのように役立つか

[[378110]]デジタル技術の導入に関しては、製薬業界では導入が遅れる傾向にあります。これまで、...

北京冬季オリンピックのブラックテクノロジーが外国人に賞賛される:このロボットがある限り、防疫は安全

昨日、北京冬季オリンピックはブラックテクノロジーでいっぱいだとネットユーザーが言っているのを見ました...

なぜ AIoT が将来の主流となるのでしょうか?

エンジニアであれ消費者であれ、AIとIoT技術が私たちの生活にもたらした変化は誰もが感じています。ビ...