「アルゴリズムの構成」は「ブラックボックス」を明らかにする:アルゴリズムは数学に関するものだが、人間に関するものである

「アルゴリズムの構成」は「ブラックボックス」を明らかにする:アルゴリズムは数学に関するものだが、人間に関するものである

アルゴリズムは私たちの生活の中でますます一般的なものになってきています。

しかし、アルゴリズムに関する研究の多くは、依然としてアルゴリズムを自律的に動作する「ブラックボックス」として捉えています。アルゴリズムを人間の要素から切り離して孤立した視点で見ると、誤った理解や結論につながる可能性があります。

スイスのローザンヌ大学STS研究所の博士研究員であるフロリアン・ジャトン氏は、「アルゴリズムの構成」という本を執筆し、アルゴリズムを内部から探究することでアルゴリズムの人間的側面を明らかにした。

ジェイトン氏の本は、人、欲望、文書、好奇心といった一見無関係に見える存在から始めて、これらすべてがどのように組み合わさり相互作用して「アルゴリズム」と呼ばれるものを形成するかを研究するという独自の視点をとっています。

「2013年にこの問題に興味を持ち始めたとき、アルゴリズムの社会的影響に関する文献はすでにたくさんあり、概してかなり批判的な内容でした」とジャトン氏は語った。 「これらの研究は、アルゴリズムが私たちの生活の中でどのように機能するかを明らかにしているが、その不透明性も浮き彫りにしている。」

これらの研究は重要ですが、Jaton のアルゴリズムへの焦点はこれにとどまりません。

「アルゴリズムは、リモート コードと難解な数学で作られた抽象的な存在として考えられていることが特に心配です。では、抽象的で難解な存在に対して実際にどう対処するのでしょうか。アルゴリズムの批判的な説明では、経験的に認識できる結果はあまり得られないように思えます。」

問題は、これまでアルゴリズムはレポートやソフトウェア、学術論文といった形で観察し、外部から研究されてきたことだとジェイトン氏は考えている。この方法論は、「初期段階でアルゴリズムの形成に重要な役割を果たすフレームワーク」を除外しますが、これらの要素はまさに脆弱です。

ジャトン氏は、一つの解決策として、文書分析だけに頼るのではなく(そうした分析も重要であることに変わりはないが)、科学的な意味で人類学を導入することだと考えている。 「

ジェイトン氏は、コンピューター ビジョン アルゴリズムに取り組む研究科学者チームの一員として、2 年半かけて『The Constitution of Algorithms』を執筆しました。

Jaton は、ディスカッション、データ収集、プログラミング セッション、コード デバッグの実践、理論の改良に参加し、それらを文書化しました。彼は、アルゴリズムの作成に費やされる重要な作業の多くが、実際の社会環境でアルゴリズムを研究する際に見落とされていることに気づきました。

Jaton は、アルゴリズムの構築を、マッピング、プログラミング、およびファイナライズという 3 つの主要な段階に分解します。

ステップ1: 真実を明らかにする

現実には、コンピューター科学者、研究者、エンジニアのグループが集まってアルゴリズムを作成する場合、そのアルゴリズムは当初、願望、スキル、手段、希望などのさまざまな要素によって推進されます。

たとえば、研究グループが、以前に発表された科学論文の結果に挑戦したり、それを上回ったりしたいと考えている場合、これらの人々は、この目標を達成するために頼りになる一連の数学的手段とプログラミング スキルを備えています。

そうすることで、目標達成に役立つコンピューティング リソース、学術論文、デジタル ツールにアクセスできるようになります。最後に、医療用画像の品質向上など、科学分野で変化をもたらしたい、または製造工場のプロセス欠陥を検出できるアルゴリズムの開発など、後で製品化できる問題を解決したいと考えるかもしれません。

しかし、目標を達成できるアルゴリズムを開発する前に、これらの人々は「問題化」と「経験主義」のプロセスを経なければなりません。この段階では、研究者は解決したい問題を正確に定義し、アルゴリズムを検証するために必要なデータの種類を決定する必要があります。

一方、オブジェクト検出アルゴリズムでは、画像内のオブジェクトの座標や、場合によっては他のパラメータ情報(画像にはオブジェクトが 1 つだけ含まれているのか、それとも複数含まれているのか)も決定する必要があります。アルゴリズムが使用される環境では照明条件は異なりますか?オブジェクトはさまざまな背景に対して表示されますか、それとも常に同じ背景に対して表示されますか?

問題が提起されると、研究者は正しい資料を収集し、その後に確立されたアルゴリズムとモデルを検証することで「真実」を確立する必要があります。

コンピューター ビジョン アルゴリズムを例にとると、研究者は問題の説明に一致し、機械学習モデルのトレーニングに使用できる画像データセットを収集する必要があります。

「猫認識」アルゴリズムでは、「猫である/猫ではない」という画像ラベルがグラウンドトゥルースである。

これらの画像には、アルゴリズムをテストするために必要なデータが添付されている必要があります。たとえば、オブジェクト検出アルゴリズムを作成する場合、各画像に含まれるオブジェクトの境界ボックスに関するデータを注釈として付ける必要があります。

問題や実際の状況についての考え方がアルゴリズムとその有効性に大きく影響することを理解することが重要です。

たとえば、オブジェクトが中央にあるグラウンドトゥルースから導出されたオブジェクト検出アルゴリズムは、類似した画像ではうまく機能しますが、複数の散在したオブジェクトを含む画像ではまったく機能しません。

実際、Jaton 氏が『アルゴリズムの構成』で指摘しているように、「私たちが得るのは、グラウンド トゥルースのためのアルゴリズムです。」

「アルゴリズムが結果を生成したら、人々の反応はこうなるはずです。このアルゴリズムはどの Ground Truth データベースから結果を得たのか?」

Ground Truth プロセスを調べて文書化することは、特にアルゴリズムが機密性の高いタスクを実行するために開発されている場合、アルゴリズムとその社会への影響を研究する上で非常に重要です。

設計の不備により、アルゴリズムが誤った偏った判断を下したり、バブルを生み出したり、フェイクニュースを拡散したりするなど、重大なミスを犯した例はすでに数多くあります。

アルゴリズムのリスクを理解し、対処することへの関心が高まっています。 Ground Truth を徹底的に調査して文書化する方法こそが、アルゴリズムのリスクに対処する鍵となります。

『アルゴリズムの形成』の中で、ジェイトンは次のように書いています。「アルゴリズムの形成に影響を与える実際の作業が抽象的で不確定なままである限り、アルゴリズムの構築と開発のエコロジーを改善することは非常に困難なままです。」

プログラミングプロセス

最終的に、アルゴリズムはプログラミング段階に到達します。与えられた問題を解決するために一連のモジュールと指示が作成され、基本的な事実に基づいてテストされます。プロセスは純粋なソースコードにまで簡略化されることが多いが、プログラミングは一連の命令を積み重ねるだけよりもはるかに複雑だとジェイトン氏は著書に書いている。

実存主義者がプログラムを存在させるものは何かと問うとき、彼らは形式よりも高いレベルを理解できず、これらの高いレベルこそが正確に説明される必要があるものである。コンピュータを使って思考を比喩的に説明するのは悪循環です。実存主義者は最終的に、コンピュータ プログラムとその開発を説明するためにさまざまな心理学的手法を提案しました。

この見解には多くの欠陥があり、コンピュータ開発の歴史に根ざしています。科学者、研究者、企業は、コンピューターを人間の脳の思考パターンに基づいて作成された入出力システムとして捉えようとしています。

しかし、現実には、人間の心はコンピュータ プログラムの「有機バージョン」です。言い換えれば、コンピュータ プログラムが「オリジナル」であり、人間の思考は、コンピュータ プログラムのモデルを人間の脳が再現したものに過ぎません。

これらの比喩は、プログラミングを「デジタル脳(つまり、コンピューター)に一連の指示を与える」ことに簡略化します。この簡素化により、プログラマーのトレーニングと評価の方法も変わります。新しい理解では、指示書の作成に重点が置かれ、ソフトウェア開発のための他のすべての貴重な実践は無視されることになります。

ジェイトン氏は著書の中で、彼自身と彼のチームが、指示書を書いたり、バグに遭遇したり、他のチームメンバーと問題を議論したりした経験を記録しています。

彼は、プロセス中にプログラムを調整して改善すること、チームメンバーとより多くコミュニケーションをとってコードを改善することが非常に重要であり、最終的にコードに反映されない他のステップや操作もあることを強調しました。彼の本を読むことで、プログラマーは自分のプログラミングとアルゴリズムの実装プロセスを比較し、通常見落とされがちな重要な詳細を発見することができます。

「プログラミングで最も見落とされがちなのは、最終的に削除されたり、最終的なコードに含まれなかったりする一時的なコードだと思います。」

ジャトン氏は、プログラミング実践のミクロ社会学的分析はまだ始まったばかりであり、既存の主張や視点はほとんどが探索的なものだと言います。したがって、この分野の将来の方向性を予測することは困難です。しかし、ミクロ社会学的研究を通じてプログラミングを習得することで、アルゴリズムの設計がより柔軟になるだろうと彼は考えています。

プログラミングの実践についてより深く理解しているプログラマーは、多くの場合、優れたプログラマーを際立たせるものです。優れたプログラマーは、アルゴリズム設計に対する深い理解をコミュニティにもたらします。

アルゴリズムの最終世代

最終的に、アルゴリズムが実装されテストされると、それは他のアルゴリズムで使用できる数学的オブジェクトになります。アルゴリズムは時の試練に耐え、その応用における価値と他の科学的研究や応用における有用性を証明しなければなりません。

これらの基準を満たしたら、アルゴリズムを再度テストする必要はありません。これは他の新しいアルゴリズムの基礎または構成要素となり、その後のアプリケーションにも引き続き利用されます。

しかし、強調しなければならないことが 1 つあります。問題、基本ルール、最終的な実装が抽象的なエンティティになると、アルゴリズムを構築するプロセスにおけるすべての細かい詳細が見えなくなります。

アルゴリズムが形成されると、それは他のアルゴリズムの基礎となり、他のアルゴリズムをテストするための基本ルールになります。

アルゴリズムが形成されると、それは他のアルゴリズムの基礎となり、基本ルールの提供、プログラミング、アルゴリズムの形成、その他の関連操作に役立ちます。アルゴリズム構成のさまざまな段階をより深く理解することで、それらを建設的に議論し、より広範な意味を探求できるようになります。

ジャトン氏は、アルゴリズムを基本ルール、プログラミング、その他のアルゴリズムの組み合わせとして理解すると、全体的な概念がはるかに複雑になると述べた。しかし、より明確かつ具体的です。

このようにアルゴリズムの意味を調べ、アルゴリズムと共進化する社会的要素によって形成される複雑なネットワークに注目することで、よりマクロな視点から、アルゴリズムと人間がますます切り離せないものになりつつある理由を理解することができます。ジェイトン氏は、「この分野ではまだもっと学び、常に視点を更新していく必要がある」と語った。

本を読むと、社会学におけるアルゴリズムの効果や機能は、社会学の概念とはかなり異なると感じる人もいるかもしれません。しかし、よく考えてみると、この区別は実は逆効果です。

新しいアルゴリズムを設計する人々も社会の一部です。彼らはアルゴリズムを設計し、他のアルゴリズムから影響を受けます。また、他のアルゴリズムを使用して新しいアルゴリズムを構築します。

したがって、アルゴリズムの有用性と使用が完全に無視され、沈黙させられる可能性は低いでしょう。アルゴリズムの設計と実装に社会学的な機能を組み込むことが必要です。

<<:  2021年中国人工知能産業の現在の市場状況と有利な軌道の分析コンピュータビジョン軌道

>>:  米国でレベル4自動運転システムの一部がリコールされた。Pony.aiはどんなミスを犯したのか?

ブログ    

推薦する

フロントエンドアルゴリズムシステム演習:リンクリストの章が完了

[[357916]]実践する前に、データ構造やアルゴリズム、あるいはこのシリーズについての誤解を避け...

DAMO アカデミーの 2020 年の予測: AI は知覚知能から認知知能へと進化する

1月2日、アリババDAMOアカデミーは2020年のトップ10テクノロジートレンドを発表しました。これ...

英国、今年末までに無人運転車の公道走行を許可へ

4月29日、外国メディアの報道によると、英国運輸省は水曜日、自動車線維持システム(ALK)を搭載した...

...

ツール・ド・フランスがChatGPTとデジタルツイン技術を導入

6月30日のニュースによると、ツール・ド・フランスは世界で最も権威のある自転車レースの一つで、毎年何...

ディープラーニングの台頭から10年:OpenAIのイノベーターたち

AlexNet、AlphaGo、GPT、CLIP、DALL-E、Codex、これらはAIの世界でセン...

...

2021年の人工知能トレンドに関する5つの予測

[[381013]]人工知能は人々の生活を変える可能性を秘めた分野です。ヘルスケア、ビジネス、金融、...

凌創志新は、AI商業化の閉ループを作成するための最初のデータアノテーションビジネスを立ち上げました

アジアのビッグデータおよび人工知能企業である凌創志信は、同社の伝統的なリテイン事業であるデータラベリ...

日常生活における人工知能の応用トップ 10

[51CTO.com クイック翻訳]経済社会の発展に伴い、テクノロジーはますます複雑になっています...

Microsoft Megvii の顔認識は 100% 動作不能! 写真の「見えないマント」で写真のプライバシー データを保護

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

解読: ボストン ダイナミクスがアルゴリズムを使用してアトラス ロボットの感覚世界を構築する方法

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

アート業界におけるメタバースの探究

メタバースの概念がますます普及するにつれて、さまざまな業界がこの豊かな土地を探索し始めました。多くの...

ロボットを活用する3つの革新的な方法

ロボットは、高齢の両親を助けたり、子供を教育したり、料理をしたりすることができます。ロボット産業は創...

サーバーレス コンピューティングによる機械学習の解決策は何でしょうか?

1. 機械学習とサーバーレス学習1.1. 機械学習 (ML) はアプリケーション シナリオでどのよ...