錬金術をより形而上学的にしましょう！蘇州大学の博士課程では「天の幹と地の枝」を使ってランダムシードを生成しており、このプロジェクトはオープンソース化されている。

機械学習は一般に「錬金術」として知られています。

一種の AI「黒魔術」として、これに少し「形而上学」を加えたらどうなるでしょうか?

最近、東呉大学の博士課程の学生が「偶然の幸運」プロジェクトに取り組みました。

この人は、機械学習で使用されるランダムシードは最終的な実験結果に影響を与えるので、運を高めるために何かした方が良いと言っていました。

オープンソースプロジェクト: https://github.com/Spico197/random-luck

まさに「東海と西海の心理は同じであり、南北の道教は分裂していない」ということになる。

数字を生成する方法は2つあります。1つは単に誕生日を入力する方法、もう1つはAI実験の開始時刻の天干と地支を計算して幸運な数字を返し、この数字をランダムシードとして使用して実験を実行する方法です。

効果はおそらく次のようになります:

コードは次のとおりです。

 #インストール

pip インストールrandluck -i https://pypi.org/simple

 ＃使用法

ランドラックを輸入する

random_seed = randluck . get_random_seed ( strategy = "bazi" )

 印刷( random_seed )



 datetime からdatetime をインポートし、 date

 random_seed = randluck . get_random_seed ( utc_datetime = datetime . utcnow ()、 strategy = "bazi" )

 印刷( random_seed )



 random_seed = randluck . get_random_seed ( utc_datetime = date ( year = 2015 、 month = 9 、 day = 7 )、 strategy = "lucky_num_by_year" )

 印刷( random_seed )

ただし、著者はこれは単なる楽しみであり、科学的な証明や説明を提供する試みはなかったと述べています。

しかし、パラメータ調整の難しさに悩むプログラマーや学生にとっては、これに幸運を祈るのはいいこと...ですよね？

著者の朱同氏は現在、蘇州大学で博士号取得を目指しており、以前は貴州大学で学士号を取得しています。

彼の研究対象には、IoT 設計、関係抽出、イベント抽出などがあります。

2020年にはCCKS「金融文書からのイベント抽出」タスクチームで1位を獲得し、2021年には言語とインテリジェンスコンペティション（上位5チーム）で第3位、CCKSイベントと関係性抽出タスク技術革新賞を受賞しました。

天の幹と地の枝

今日、天地分身が実在すると心から信じている科学的な考え方を持つプログラマーはほとんどいませんが、それは天地分身の概念を熱心に使う人々も同じように考えているということを意味するものではありません。

中国古代文献研究の第一人者であり巨匠である郭沫若の研究によれば、紀元前13世紀から12世紀に古代中国で初めて現れた「十二支」と「太歳暦」は、紀元前45世紀から23世紀に古代西アジアで初めて現れ、紀元前13世紀に成熟した「干支」制度に由来している。

「十二支」に対応する 12 の「太歳年名」は、「十二支」を表す古代シュメール語とアッカド語の発音を音訳したものです。古代西アジアの粘土板に描かれた「黄道帯」の星座記号は、後の甲骨文字の「十二支」とほぼ完全に同一です。

古代西アジアの星座図

つまり、天干地支と十二支の占術は、実は似たような起源を持っているのです。 CNN に国境がなくなったように、誰もがそれを見たいと思っています...

数千年前の古代西アジア人や古代中国人が干支/干支をどのように捉えていたかは、現代の AI 実践者が LeCun をどのように捉えているかに似ています。それらはすべて最先端の技術であり、たとえ私が理解できなくても、専門家の言うことは非常に印象深いに違いありません。

したがって、シミュレータを使用して無駄な支出を吐き出すことは、古代の最先端技術と現代の最先端技術の合流と見なすことができます。

結局のところ、SF作家のハインラインはかつてこう言った。「あなたが素晴らしいと思う超自然現象は、すべて、その創造者にとっては非常に厄介な精密工学的現象である。」

ランダムシード

概念的には、シード値は乱数ジェネレーターを生成するために使用されます。また、同じシード値を使用するたびに、同じランダム値が得られます。

つまり、ランダムシードにより、コードを再実行するすべての人がまったく同じ出力を得ることが保証されます。

通常、次の 2 つのタスクで使用されます。

1. データをトレーニング/検証/テストセットに分割する: ランダムシードにより、コードが実行されるたびにデータが同じ方法で分割されることが保証されます。

2. モデルのトレーニング: ランダムフォレストや勾配ブースティングなどのアルゴリズムは非決定論的(与えられた入力に対して、出力は常に同じではない)であるため、再現可能な結果を得るにはランダムシードパラメータが必要です。

再現性に加えて、参照結果を得るためにはランダムシードも重要です。たとえば、アルゴリズムの複数のバージョンをテストする場合、すべてのバージョンが同じデータを使用し、可能な限り類似していることが重要です (テストする必要があるパラメーターを除く)。

ランダムシードは重要であるにもかかわらず、ほとんど手間をかけずに設定されることがよくあります。たとえば、作業していた日付（2020 年 3 月 1 日）を使用する場合、シードは 20200301 になります。

毎回同じシードを使用するものもあれば、ランダムに生成するものもあります。

たとえば、Scikit-learn を使用して機械学習モデルをトレーニングする場合、sklearn.model_selection モジュールからインポートされた関数 train_test_split は、ランダム状態などのパラメータを使用してランダムシードの入力を取得します。

 sklearn からデータセットをインポートする
sklearn.model_selection からtrain_test_split をインポートします
アイリス= datasets.load_iris ( )
 X = 虹彩データ
y = アイリス. ターゲット
X_train 、 X_test 、 y_train 、 y_test = train_test_split ( X 、 y 、 test_size = 0.3 、 random_state = 42 )

パラメーター random_state=42 は、上記のコードを実行するたびにランダムシードを同じ値に設定し、同じ検証セット (X_test、y_test) を取得します。

AIがあなたの毎日の星占いを作成します

もちろん、AIがトラブルを引き起こすというロマンチックな考えは、中国のプログラマーに限ったことではありません。 AIを使って星占いを書くというアイデアは、アメリカのプログラマーの間でも浮上している。

2017年、VICE誌は、コーディングスキル、製品開発スキル、そして占星術への愛着を持つニューヨークのプログラマー3人が、当時市場に出回っていた「スマート星占い」や「自動星占い」アプリが、1990年代のスーザン・ミラーらの研究を繰り返すことしかできないことに悩み、独自の「星占いアルゴリズム」を作ったと報じた。

基本的な仕組みは複雑ではありません。開発者はまず、さまざまな天体の動きに対応する占星術の解釈を入力し、同時に NASA の公開天体追跡データを自動的に収集するインターフェースを開発します。次に、これらのデータの計算結果を一致させるアルゴリズムを開発し、同時に、アルゴリズムの結果を「あなたの毎日の星占い」の記事の形で表示できるように自然言語ジェネレーターを開発しました。

これらの占星術愛好家は、非常に優秀なプロダクトマネージャーの能力も持っています。「占星術アルゴリズム」アプリは、友達を追加するソーシャル機能に特に重点を置いています。各人の星占いを比較できるだけでなく、各人の間の星占いの相性を生成することもできます。

さまざまな天体が12星座に「入り」、それが各人やその友人の運命にどのような影響を与えるか、また相互作用もアプリ上で紹介されます。追加する友達の数が増えるほど、結果はより具体的になります。

「占星術アルゴリズム」の開発者は、VICE に嬉しそうにこう語った。「もちろん、これは科学的な占いではないことはわかっています。しかし、これは古代神話と現代人の性格の両方に基づいた、興味深い物語の伝え方であり、非常に興味深いものです。」

しかし、恋愛が普遍的であるだけでなく、独身でいられる能力に頼る理系の学生の性格もまた普遍的であるようだ。 2020年、あるプログラマーがTwitterにアクセスし、星占いツイートの返信における絵文字の頻度を生データとしてサンプリングし、統計を実行するプロジェクトを作成しました。回答の正確さは、占星術が本当に効果的に運命を占うことができるかどうかを検証するために使用されます...

ナンセンス、もちろんそんなことはない。それは本当にロマンチックじゃない。このプロジェクトをやっている人には、絶対にガールフレンドはいない。

<<: 1万語に及ぶ長い記事です！ディープマインドの科学者が2021年の高エネルギー研究15件をまとめる

>>: 拡散モデルはオートエンコーダです。ディープマインドの研究者は新しいアイデアを提案し、