錬金術をより形而上学的にしましょう!蘇州大学の博士課程では「天の幹と地の枝」を使ってランダムシードを生成しており、このプロジェクトはオープンソース化されている。

錬金術をより形而上学的にしましょう!蘇州大学の博士課程では「天の幹と地の枝」を使ってランダムシードを生成しており、このプロジェクトはオープンソース化されている。

機械学習は一般に「錬金術」として知られています。

一種の AI「黒魔術」として、これに少し「形而上学」を加えたらどうなるでしょうか?

最近、東呉大学の博士課程の学生が「偶然の幸運」プロジェクトに取り組みました。

この人は、機械学習で使用されるランダムシードは最終的な実験結果に影響を与えるので、運を高めるために何かした方が良いと言っていました。

オープンソースプロジェクト: https://github.com/Spico197/random-luck

まさに「東海と西海の心理は同じであり、南北の道教は分裂していない」ということになる。

数字を生成する方法は2つあります。1つは単に誕生日を入力する方法、もう1つはAI実験の開始時刻の天干と地支を計算して幸運な数字を返し、この数字をランダムシードとして使用して実験を実行する方法です。

効果はおそらく次のようになります:

コードは次のとおりです。

 #インストール

pip インストールrandluck -i https://pypi.org/simple

#使用法

ランドラックを輸入する

random_seed = randluck . get_random_seed ( strategy = "bazi" )

印刷( random_seed )



datetime からdatetime をインポートしdate

random_seed = randluck . get_random_seed ( utc_datetime = datetime . utcnow ()、 strategy = "bazi" )

印刷( random_seed )



random_seed = randluck . get_random_seed ( utc_datetime = date ( year = 2015month = 9day = 7 )、 strategy = "lucky_num_by_year" )

印刷( random_seed )

ただし、著者はこれは単なる楽しみであり、科学的な証明や説明を提供する試みはなかったと述べています。

しかし、パラメータ調整の難しさに悩むプログラマーや学生にとっては、これに幸運を祈るのはいいこと...ですよね?

著者の朱同氏は現在、蘇州大学で博士号取得を目指しており、以前は貴州大学で学士号を取得しています。

彼の研究対象には、IoT 設計、関係抽出、イベント抽出などがあります。

2020年にはCCKS「金融文書からのイベント抽出」タスクチームで1位を獲得し、2021年には言語とインテリジェンスコンペティション(上位5チーム)で第3位、CCKSイベントと関係性抽出タスク技術革新賞を受賞しました。

天の幹と地の枝

今日、天地分身が実在すると心から信じている科学的な考え方を持つプログラマーはほとんどいませんが、それは天地分身の概念を熱心に使う人々も同じように考えているということを意味するものではありません。

中国古代文献研究の第一人者であり巨匠である郭沫若の研究によれば、紀元前13世紀から12世紀に古代中国で初めて現れた「十二支」と「太歳暦」は、紀元前45世紀から23世紀に古代西アジアで初めて現れ、紀元前13世紀に成熟した「干支」制度に由来している。

「十二支」に対応する 12 の「太歳年名」は、「十二支」を表す古代シュメール語とアッカド語の発音を音訳したものです。古代西アジアの粘土板に描かれた「黄道帯」の星座記号は、後の甲骨文字の「十二支」とほぼ完全に同一です。

古代西アジアの星座図

つまり、天干地支と十二支の占術は、実は似たような起源を持っているのです。 CNN に国境がなくなったように、誰もがそれを見たいと思っています...

数千年前の古代西アジア人や古代中国人が干支/干支をどのように捉えていたかは、現代の AI 実践者が LeCun をどのように捉えているかに似ています。それらはすべて最先端の技術であり、たとえ私が理解できなくても、専門家の言うことは非常に印象深いに違いありません。

したがって、シミュレータを使用して無駄な支出を吐き出すことは、古代の最先端技術と現代の最先端技術の合流と見なすことができます。

結局のところ、SF作家のハインラインはかつてこう言った。「あなたが素晴らしいと思う超自然現象は、すべて、その創造者にとっては非常に厄介な精密工学的現象である。」

ランダムシード

概念的には、シード値は乱数ジェネレーターを生成するために使用されます。また、同じシード値を使用するたびに、同じランダム値が得られます。

つまり、ランダム シードにより、コードを再実行するすべての人がまったく同じ出力を得ることが保証されます。

通常、次の 2 つのタスクで使用されます。

1. データをトレーニング/検証/テストセットに分割する: ランダムシードにより、コードが実行されるたびにデータが同じ方法で分割されることが保証されます。

2. モデルのトレーニング: ランダムフォレストや勾配ブースティングなどのアルゴリズムは非決定論的(与えられた入力に対して、出力は常に同じではない)であるため、再現可能な結果を​​得るにはランダムシードパラメータが必要です。

再現性に加えて、参照結果を得るためにはランダムシードも重要です。たとえば、アルゴリズムの複数のバージョンをテストする場合、すべてのバージョンが同じデータを使用し、可能な限り類似していることが重要です (テストする必要があるパラメーターを除く)。

ランダム シードは重要であるにもかかわらず、ほとんど手間をかけずに設定されることがよくあります。たとえば、作業していた日付(2020 年 3 月 1 日)を使用する場合、シードは 20200301 になります。

毎回同じシードを使用するものもあれば、ランダムに生成するものもあります。

たとえば、Scikit-learn を使用して機械学習モデルをトレーニングする場合、sklearn.model_selection モジュールからインポートされた関数 train_test_split は、ランダム状態などのパラメータを使用してランダム シードの入力を取得します。

 sklearn からデータセットをインポートする
sklearn.model_selection からtrain_test_split インポートします
アイリス= datasets.load_iris ( )
X = 虹彩データ
y = アイリス. ターゲット
X_trainX_testy_trainy_test = train_test_split ( Xytest_size = 0.3random_state = 42 )

パラメーター random_state=42 は、上記のコードを実行するたびにランダム シードを同じ値に設定し、同じ検証セット (X_test、y_test) を取得します。

AIがあなたの毎日の星占いを作成します

もちろん、AIがトラブルを引き起こすというロマンチックな考えは、中国のプログラマーに限ったことではありません。 AIを使って星占いを書くというアイデアは、アメリカのプログラマーの間でも浮上している。

2017年、VICE誌は、コーディングスキル、製品開発スキル、そして占星術への愛着を持つニューヨークのプログラマー3人が、当時市場に出回っていた「スマート星占い」や「自動星占い」アプリが、1990年代のスーザン・ミラーらの研究を繰り返すことしかできないことに悩み、独自の「星占いアルゴリズム」を作ったと報じた。

基本的な仕組みは複雑ではありません。開発者はまず、さまざまな天体の動きに対応する占星術の解釈を入力し、同時に NASA の公開天体追跡データを自動的に収集するインターフェースを開発します。次に、これらのデータの計算結果を一致させるアルゴリズムを開発し、同時に、アルゴリズムの結果を「あなたの毎日の星占い」の記事の形で表示できるように自然言語ジェネレーターを開発しました。

これらの占星術愛好家は、非常に優秀なプロダクト マネージャーの能力も持っています。「占星術アルゴリズム」アプリは、友達を追加するソーシャル機能に特に重点を置いています。各人の星占いを比較できるだけでなく、各人の間の星占いの相性を生成することもできます。

さまざまな天体が12星座に「入り」、それが各人やその友人の運命にどのような影響を与えるか、また相互作用もアプリ上で紹介されます。追加する友達の数が増えるほど、結果はより具体的になります。

「占星術アルゴリズム」の開発者は、VICE に嬉しそうにこう語った。「もちろん、これは科学的な占いではないことはわかっています。しかし、これは古代神話と現代人の性格の両方に基づいた、興味深い物語の伝え方であり、非常に興味深いものです。」

しかし、恋愛が普遍的であるだけでなく、独身でいられる能力に頼る理系の学生の性格もまた普遍的であるようだ。 2020年、あるプログラマーがTwitterにアクセスし、星占いツイートの返信における絵文字の頻度を生データとしてサンプリングし、統計を実行するプロジェクトを作成しました。回答の正確さは、占星術が本当に効果的に運命を占うことができるかどうかを検証するために使用されます...

ナンセンス、もちろんそんなことはない。それは本当にロマンチックじゃない。このプロジェクトをやっている人には、絶対にガールフレンドはいない。

<<:  1万語に及ぶ長い記事です!ディープマインドの科学者が2021年の高エネルギー研究15件をまとめる

>>:  拡散モデルはオートエンコーダです。ディープマインドの研究者は新しいアイデアを提案し、

ブログ    
ブログ    
ブログ    

推薦する

ビジネスコミュニケーションで機械学習を活用する9つの方法

人工知能 (AI) と機械学習 (ML) は、職場でも家庭でも、私たちの生活に欠かせないものになりつ...

人工知能は伝染病の予防と制御に役立ちます。正確にスクリーニングし、伝染病を推測し、ウイルスの発生源を追跡することができます。

感染予防・抑制の過程では、高リスクグループとスーパースプレッダーを迅速に特定し、感染の進行状況を正確...

...

クラウドコンピューティングと人工知能の発展により、ITセキュリティは大幅に向上しました。

データ侵害が頻繁に起こるようになるにつれて、IT セキュリティの重要性がますます高まります。幸いなこ...

AIは当面、都市のゴミ出しを支援できないかもしれない

上海がゴミの分別を推進し始めて以来、クレイジーな上海寧は多くのジョークや絵文字を投稿し、大多数のネッ...

欧州が世界クラスの人工知能研究機関を建設へ

英国の「ガーディアン」ウェブサイトは、この新しい研究所を設立した理由は、欧州原子核研究機構を設立した...

5Gベアラネットワークの運用は難しいが、機械学習技術で解決できる

5G の商用化が近づいており、通信事業者が 5G ベアラ ネットワークを構築するための時間はあまり残...

Google GlassのDIY貧弱版、カスタムジェスチャーコントロール、Raspberry Piがまたもや新しい遊び方を開発

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

人工知能教育とは何ですか?将来の教育の顕著な特徴は何でしょうか?

グローバル情報化教育の時代において、教育モデル、教育内容、学習方法は大きな変化を遂げており、人工知能...

再帰アルゴリズムの深い理解、誤解された再帰

[[333118]]再帰は、プログラミングの本で説明するのが最も難しい部分である魔法のアルゴリズムで...

人工知能の時代が到来すると、私たちはどこへ向かうのでしょうか?

[[348861]]人工知能の時代が本格的に到来しました。私たちの生活のいたるところに見られる人工...

ハイブリッドクラウドプラットフォームがデータの障壁を打ち破り、人工知能がデータの価値を活性化

デジタル経済の時代において、企業の将来の競争力を形成する鍵として、データの価値は企業からますます注目...

現時点で最も包括的なPythonの採用方針

Pythonは、コンパイル速度が超高速なオブジェクト指向プログラミング言語です。誕生から25年が経ち...