AIビッグモデルにおける言語の不平等:英語は最も安価、他の言語ははるかに高価

AIビッグモデルにおける言語の不平等:英語は最も安価、他の言語ははるかに高価

7月31日、ユーザーが使用する言語が大規模言語モデル(LLM)のコストに大きな影響を与え、英語話者と他言語話者の間に人工知能の格差が生じる可能性があると報告された。最近の調査によると、OpenAIなどのサービスがサーバーのコストを測定し請求する方法により、英語の入力と出力は他の言語よりもはるかに安く、簡体字中国語は英語の約2倍、スペイン語は1.5倍、ビルマ語のシャン語は15倍のコストがかかるという

IT Homeは、TwitterユーザーのDylan Patel (@dlan522p)がオックスフォード大学が実施した調査の写真を共有したことに気付きました。その調査では、LLMがビルマ語の文章を処理するのに198トークンかかるのに対し、英語で書かれた同じ文章には17トークンしかかからないことがわかりました。トークンは、OpenAI の ChatGPT や Anthropic の Claude 2 などの API を介して LLM にアクセスするための計算コストを表します。つまり、ビルマ語の文章は英語の文章よりも 11 倍コストがかかります。

トークン化は、AI企業がユーザーの入力を計算コストに変換する方法であり、英語以外の言語でモデルを使用およびトレーニングするにはコストがはるかに高くなることを意味します。これは、中国語などの言語は構造が異なり、より複雑であるため(文法と文字数の両方の点で)、より高いレマ率が必要になるためです。たとえば、OpenAI の GPT3 トークナイザーによると、「your Affection」というトークンは英語では 2 つのトークンしか必要としませんが、簡体字中国語では 8 つのトークンが必要になります。簡体字中国語のテキストには 4 文字 (your love) しかありませんが、英語のテキストには 14 文字あります。

<<:  マイクロソフト、自然言語インターフェース開発を簡素化する TypeChat ライブラリを発表

>>:  保険詐欺防止リスク管理の実践

ブログ    

推薦する

AIは単なるコードかもしれないが、それは私たちのコードだ

AI に対する期待は高すぎるのでしょうか? また、企業とその経営陣は AI が提供する成果にどの程度...

調査によると、ヨーロッパ人はロボットに対してますます懐疑的になっている

海外メディアの報道によると、ヨーロッパ人は5年前よりもロボットに対して保守的になっていることが調査で...

トレンドにおける危険とチャンス: 生成 AI の黄金期をどう捉えるか?

ChatGPTは今年9月末に音声チャットと画像認識機能を追加しました。テキスト駆動型と比較して、C...

...

人工知能の台頭が懸念を引き起こしています。私たちはどう対応すべきでしょうか?

AlphaGoがイ・セドルに勝利したことで世界は人工知能に再び親しむようになったが、アップグレード...

XiaomiのFALSRアルゴリズムが正式にオープンソース化され、画像超解像エンジニアリングアプリケーションに大きな進歩をもたらしました。

本日、Xiaomi は、弾性探索 (マクロ + ミクロ) に基づく超解像で驚くべき結果を達成した新し...

トランスワープテクノロジーの孫元浩氏が「中国の人工知能起業家30人」の一人に選出

2020 年は特別な年であり、World Innovators Meet (WIM) の 6 年目と...

自動運転は道路安全の問題をどのように解決するのでしょうか?

最近、自動運転に関する悪いニュースが数多く報道されていますが、特にアリゾナ州で Uber の自動運転...

...

ネットワークディスク上の大きなモデルを使うのはとても気持ちがいいです!隠された写真は3秒で発見され、親戚や友人全員が衝撃を受けた

AIの助けを借りて、自分が会社の重役になれる日が来るとは思ってもいませんでした!同僚のクローゼットの...

...

...

人工知能とモノのインターネットがスマートライフを推進

AI と IoT テクノロジーがスマート シティにどのような革命をもたらしているか。人工知能 (AI...

近い将来、人工知能は多くの人々の仕事を置き換えることになるだろう

清華大学金融学科教授の李道奥氏は、ハーバード大学で経済学の博士号を取得。スタンフォード大学フーバー研...

AIが高収入の仕事を生み出すと同時に仕事を代替できる理由

自動化、特に人工知能とロボット工学の進歩が、今日の労働者にとって問題となるかどうか。この議論は毎日繰...