錬金術をより形而上学的にしましょう!蘇州大学の博士課程では「天の幹と地の枝」を使ってランダムシードを生成しており、このプロジェクトはオープンソース化されている。

錬金術をより形而上学的にしましょう!蘇州大学の博士課程では「天の幹と地の枝」を使ってランダムシードを生成しており、このプロジェクトはオープンソース化されている。

機械学習は一般に「錬金術」として知られています。

一種の AI「黒魔術」として、これに少し「形而上学」を加えたらどうなるでしょうか?

最近、東呉大学の博士課程の学生が「偶然の幸運」プロジェクトに取り組みました。

この人は、機械学習で使用されるランダムシードは最終的な実験結果に影響を与えるので、運を高めるために何かした方が良いと言っていました。

オープンソースプロジェクト: https://github.com/Spico197/random-luck

まさに「東海と西海の心理は同じであり、南北の道教は分裂していない」ということになる。

数字を生成する方法は2つあります。1つは単に誕生日を入力する方法、もう1つはAI実験の開始時刻の天干と地支を計算して幸運な数字を返し、この数字をランダムシードとして使用して実験を実行する方法です。

効果はおそらく次のようになります:

コードは次のとおりです。

 #インストール

pip インストールrandluck -i https://pypi.org/simple

#使用法

ランドラックを輸入する

random_seed = randluck . get_random_seed ( strategy = "bazi" )

印刷( random_seed )



datetime からdatetime をインポートしdate

random_seed = randluck . get_random_seed ( utc_datetime = datetime . utcnow ()、 strategy = "bazi" )

印刷( random_seed )



random_seed = randluck . get_random_seed ( utc_datetime = date ( year = 2015month = 9day = 7 )、 strategy = "lucky_num_by_year" )

印刷( random_seed )

ただし、著者はこれは単なる楽しみであり、科学的な証明や説明を提供する試みはなかったと述べています。

しかし、パラメータ調整の難しさに悩むプログラマーや学生にとっては、これに幸運を祈るのはいいこと...ですよね?

著者の朱同氏は現在、蘇州大学で博士号取得を目指しており、以前は貴州大学で学士号を取得しています。

彼の研究対象には、IoT 設計、関係抽出、イベント抽出などがあります。

2020年にはCCKS「金融文書からのイベント抽出」タスクチームで1位を獲得し、2021年には言語とインテリジェンスコンペティション(上位5チーム)で第3位、CCKSイベントと関係性抽出タスク技術革新賞を受賞しました。

天の幹と地の枝

今日、天地分身が実在すると心から信じている科学的な考え方を持つプログラマーはほとんどいませんが、それは天地分身の概念を熱心に使う人々も同じように考えているということを意味するものではありません。

中国古代文献研究の第一人者であり巨匠である郭沫若の研究によれば、紀元前13世紀から12世紀に古代中国で初めて現れた「十二支」と「太歳暦」は、紀元前45世紀から23世紀に古代西アジアで初めて現れ、紀元前13世紀に成熟した「干支」制度に由来している。

「十二支」に対応する 12 の「太歳年名」は、「十二支」を表す古代シュメール語とアッカド語の発音を音訳したものです。古代西アジアの粘土板に描かれた「黄道帯」の星座記号は、後の甲骨文字の「十二支」とほぼ完全に同一です。

古代西アジアの星座図

つまり、天干地支と十二支の占術は、実は似たような起源を持っているのです。 CNN に国境がなくなったように、誰もがそれを見たいと思っています...

数千年前の古代西アジア人や古代中国人が干支/干支をどのように捉えていたかは、現代の AI 実践者が LeCun をどのように捉えているかに似ています。それらはすべて最先端の技術であり、たとえ私が理解できなくても、専門家の言うことは非常に印象深いに違いありません。

したがって、シミュレータを使用して無駄な支出を吐き出すことは、古代の最先端技術と現代の最先端技術の合流と見なすことができます。

結局のところ、SF作家のハインラインはかつてこう言った。「あなたが素晴らしいと思う超自然現象は、すべて、その創造者にとっては非常に厄介な精密工学的現象である。」

ランダムシード

概念的には、シード値は乱数ジェネレーターを生成するために使用されます。また、同じシード値を使用するたびに、同じランダム値が得られます。

つまり、ランダム シードにより、コードを再実行するすべての人がまったく同じ出力を得ることが保証されます。

通常、次の 2 つのタスクで使用されます。

1. データをトレーニング/検証/テストセットに分割する: ランダムシードにより、コードが実行されるたびにデータが同じ方法で分割されることが保証されます。

2. モデルのトレーニング: ランダムフォレストや勾配ブースティングなどのアルゴリズムは非決定論的(与えられた入力に対して、出力は常に同じではない)であるため、再現可能な結果を​​得るにはランダムシードパラメータが必要です。

再現性に加えて、参照結果を得るためにはランダムシードも重要です。たとえば、アルゴリズムの複数のバージョンをテストする場合、すべてのバージョンが同じデータを使用し、可能な限り類似していることが重要です (テストする必要があるパラメーターを除く)。

ランダム シードは重要であるにもかかわらず、ほとんど手間をかけずに設定されることがよくあります。たとえば、作業していた日付(2020 年 3 月 1 日)を使用する場合、シードは 20200301 になります。

毎回同じシードを使用するものもあれば、ランダムに生成するものもあります。

たとえば、Scikit-learn を使用して機械学習モデルをトレーニングする場合、sklearn.model_selection モジュールからインポートされた関数 train_test_split は、ランダム状態などのパラメータを使用してランダム シードの入力を取得します。

 sklearn からデータセットをインポートする
sklearn.model_selection からtrain_test_split インポートします
アイリス= datasets.load_iris ( )
X = 虹彩データ
y = アイリス. ターゲット
X_trainX_testy_trainy_test = train_test_split ( Xytest_size = 0.3random_state = 42 )

パラメーター random_state=42 は、上記のコードを実行するたびにランダム シードを同じ値に設定し、同じ検証セット (X_test、y_test) を取得します。

AIがあなたの毎日の星占いを作成します

もちろん、AIがトラブルを引き起こすというロマンチックな考えは、中国のプログラマーに限ったことではありません。 AIを使って星占いを書くというアイデアは、アメリカのプログラマーの間でも浮上している。

2017年、VICE誌は、コーディングスキル、製品開発スキル、そして占星術への愛着を持つニューヨークのプログラマー3人が、当時市場に出回っていた「スマート星占い」や「自動星占い」アプリが、1990年代のスーザン・ミラーらの研究を繰り返すことしかできないことに悩み、独自の「星占いアルゴリズム」を作ったと報じた。

基本的な仕組みは複雑ではありません。開発者はまず、さまざまな天体の動きに対応する占星術の解釈を入力し、同時に NASA の公開天体追跡データを自動的に収集するインターフェースを開発します。次に、これらのデータの計算結果を一致させるアルゴリズムを開発し、同時に、アルゴリズムの結果を「あなたの毎日の星占い」の記事の形で表示できるように自然言語ジェネレーターを開発しました。

これらの占星術愛好家は、非常に優秀なプロダクト マネージャーの能力も持っています。「占星術アルゴリズム」アプリは、友達を追加するソーシャル機能に特に重点を置いています。各人の星占いを比較できるだけでなく、各人の間の星占いの相性を生成することもできます。

さまざまな天体が12星座に「入り」、それが各人やその友人の運命にどのような影響を与えるか、また相互作用もアプリ上で紹介されます。追加する友達の数が増えるほど、結果はより具体的になります。

「占星術アルゴリズム」の開発者は、VICE に嬉しそうにこう語った。「もちろん、これは科学的な占いではないことはわかっています。しかし、これは古代神話と現代人の性格の両方に基づいた、興味深い物語の伝え方であり、非常に興味深いものです。」

しかし、恋愛が普遍的であるだけでなく、独身でいられる能力に頼る理系の学生の性格もまた普遍的であるようだ。 2020年、あるプログラマーがTwitterにアクセスし、星占いツイートの返信における絵文字の頻度を生データとしてサンプリングし、統計を実行するプロジェクトを作成しました。回答の正確さは、占星術が本当に効果的に運命を占うことができるかどうかを検証するために使用されます...

ナンセンス、もちろんそんなことはない。それは本当にロマンチックじゃない。このプロジェクトをやっている人には、絶対にガールフレンドはいない。

<<:  1万語に及ぶ長い記事です!ディープマインドの科学者が2021年の高エネルギー研究15件をまとめる

>>:  拡散モデルはオートエンコーダです。ディープマインドの研究者は新しいアイデアを提案し、

ブログ    
ブログ    
ブログ    

推薦する

llama.cppを勉強した後、携帯電話で大規模なモデルを実行するのはとても簡単だと分かりました

最近、オープンソース コミュニティでは、大規模モデルの最適化手法を模索する人が増えています。 LLa...

銀行における会話型 AI – 企業が犯しがちな 3 つの間違い

金融サービス業界は、特定の金融プロセスに不可欠なレガシー機器やシステムを使用しているため、他の業界に...

10年後に人工知能のリーダーとなる国はどこでしょうか?アメリカ国民:中国であるべきだ

ロシアメディアは、中国の人工知能(AI)産業の急速な発展を背景に、米シンクタンクのブルッキングス研究...

人工知能の成長がデータセンターの再設計を促している

現在進行中のデータ センターの再設計の主な側面は、AI の大規模で複雑なワークロードと、グラフィック...

複数のAI企業の人事担当者/面接官が明かす:機械学習エンジニアの採用方法

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

AlphaGoの仕組み:マルチエージェント強化学習の詳細な説明

このレビュー記事では、著者はマルチインテリジェンス強化学習の理論的基礎を詳細に紹介し、さまざまなマル...

...

ブックマークにおける不正行為の特定におけるグラフィカル モデルの応用

概要グラフィカル モデルは通常、問題自体に複数の相互に関連する変数があるシナリオで使用され、これらの...

AIはオミクロン変異体の構造を1時間で予測、誤差は原子直径の半分のみ

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

投票の未来: AI、ブロックチェーン、生体認証

投票攻撃は止まらない2016年の米国大統領選挙は紆余曲折を経て、最終的にトランプ氏が米国大統領に選出...

流行後、生体認証はどこに向かうのでしょうか? 焦点は「手」に移るのでしょうか、それとも「頭」に移るのでしょうか?

庚子年の初めに、突然の疫病が中国全土に広がり、人々は突然「2003年を夢見ている」ような気分になった...

過大評価された5つのテクノロジー:誇大宣伝の裏にある現実を探る

すべてのテクノロジーが期待通りの成果を上げたり、当初の約束を果たしたりするわけではありません。技術進...

2022 年に予測されるロボット技術のトレンド トップ 10

COVID-19パンデミックは、物流やスーパーマーケットなどの分野に問題と機会の両方をもたらしまし...