AIがエンタープライズデータカタログを救う方法

AIがエンタープライズデータカタログを救う方法

「データ カタログ」という概念は、実は新しいものではありません。メインフレームの時代から、企業はデータ カタログを通じてデータ資産を追跡および管理し始めました。データ ディレクトリには、データに関連するデータ、つまりメタデータが保存されます。エンタープライズ データ カタログでは、たとえば、会社全体のすべてのデータベースとファイル、さらに可能であればファイル間の関係を記録して記述する必要があります。

データ カタログを使用すると、ビジネス ユーザーは、資産データ、会社の地理的位置、製品やサプライヤーに関する情報など、必要な情報ソースをすばやく見つけることができます。しかし、データ カタログは最新の状態に保たれている場合にのみ効果を発揮しますが、急速に変化する業界では、それを実現するのは難しい場合があります。

[[312930]]

メタデータとデータカタログ

メタデータを理解する簡単な方法は、映画の例えを使うことです。映画は放送局の映画ライブラリに保存されますが、映画のタイトル以外にも保存する必要があるものがあります。映画の長さ、出演者、監督、脚本家、脚本に関する情報など、映画のメタデータを知ることは重要です。

データ カタログ、データ ディクショナリ、ビジネス用語集などの概念については、誰もが大まかに理解していると思います。ビジネス ユーザーを対象としたビジネス用語集と、より技術的なユーザーを対象としたデータ辞書との間には微妙な違いがあります。しかし、これら 3 つの概念は明らかにメタデータに関連しており、いずれも同様の課題に直面しています。

エンタープライズデータカタログの課題

初期のデータ カタログは、データベース内のフィールドの数、フィールドが数値ベースか文字ベースか、フィールドの長さ、有効な値の範囲があるかどうかなどの技術データに重点​​を置いていました。その後、定義は拡張され、ビジネス データの種類に関する情報や、「顧客」、「製品」、「資産」などのデータの定義も含まれるようになりました。

重要な問題は、エンタープライズ データ カタログが古くなる可能性があることです。多くの場合、熱心な従業員はさまざまなシステムやデータベースの内容に関する情報を入力しますが、その情報を最新の状態に保つ動機はほとんどありません。新しいシステムが導入されたり、企業全体が買収されてそのシステムが企業ポートフォリオに追加されたり、組織再編が行われたりすると、苦労して入力された記述メタデータは古くなりすぎて信頼できなくなり、使用されなくなります。

多くの企業が効果的なカタログの実装に多大な労力を費やしていますが、ビジネスが急速に変化してもエンタープライズ データ カタログを完全に同期した状態に保つための継続的な努力を行っている企業はほとんどありません。そのため、近年ではいくつかのソフトウェアベンダーからデータカタログ、データ辞書、ビジネス用語集などの製品サービスが提供されているものの、本当の意味で広く普及するまでには至っていません。

AIとエンタープライズデータカタログ

データの量と種類が増加し続ける時代において、企業のデータ カタログを最新の状態に保つことはますます困難になっています。しかし、人工知能などの技術を応用することで、この状況は変わる可能性があります。

機械学習アプリケーションは、Google がインターネットで Web サイトやカタログを検索してインデックスを作成するのと同様に、企業のデータ カタログやファイル システムを精査してメタデータ タグを自動的に収集できます。このテクノロジーをデータ カタログに適用すると、企業は人間の介入を必要とせずにデータを自動的に入力および更新できるようになります。これにより、エンタープライズ データ カタログの妨げとなっていた主要な問題、つまり、多くの手作業による面倒な作業が必要になるという問題が解決されます。人工知能がデータカタログ市場の繁栄に貢献する可能性が高いと予測されます。

<<:  人工知能か、それとも人工的な愚かさか?予想外の大規模なアルゴリズムのロールオーバー

>>:  レポート:中国の人工知能産業は2022年までに300億ドル近くの価値に達する

ブログ    

推薦する

検証可能な AI に向けて: 形式手法の 5 つの課題

人工知能は、学習、問題解決、合理的な思考や行動など、知能と直感的に関連付けられる機能を含め、人間の知...

ML プロジェクトを実行するときに、タスクが多数あり、些細な場合はどうすればよいでしょうか?このセルフチェックリストはあなたの心を整理するのに役立ちます

機械学習プロジェクトには、データ処理、モデルの最適化など、多くの要素が関係します。開発者は混乱したり...

...

画像の混合を利用してより細かい特徴表現を学習するCMU Xing Boのチームの新しい論文がAAAIに選出されました

これは、カーネギーメロン大学とカリフォルニア大学バークレー校の Eric Xing 氏と Trevo...

28 歳の中国人 Meta ソフトウェア エンジニアが、次のような理由で年収 37 万ドルの仕事を辞めました...

物語の主人公は中国人のソフトウェアエンジニア、エリック・ユーです。 2016年、Google、Met...

人工知能を成功に導く8つのステップ

AI の実装は一度で終わるものではなく、幅広い戦略と継続的な調整のプロセスが必要です。ここでは、AI...

ディープラーニングモデルを使用して Java でテキスト感情分析を実行する

肯定的ですか? 否定的ですか? 中立的ですか? Stanford CoreNLP コンポーネントと数...

疑わないでください、それはあなたです!あなたの信頼が自動運転の運命を決める

ヒューマンエラーによる交通事故は人々を自動車恐怖症にさせませんが、自動運転車はなぜか人々を恐怖に陥れ...

ディープラーニングの最適化を理解するにはどうすればよいでしょうか?勾配降下法の軌跡を分析することで

ニューラル ネットワークの最適化は本質的に非凸ですが、単純な勾配ベースの方法は常にこのような問題を解...

自動運転は「終焉」に向かっている

技術導入への困難な道のりは、特定の客観的な法則に従わなければならず、それはいかなる利害関係者の意見に...

自動運転、顔認識…人工知能の時代が到来。私たちはどう対応すべきか?

2016年以降、人工知能がニュースに登場する頻度が高まっています。実は、理工系女子の私にとって、子...

予測: 2019 年に爆発的に普及する 10 の人工知能テクノロジー!

1. 自然言語生成自然言語生成は、データをテキストに変換し、コンピューターがこれまでにない精度でア...

脚付きロボットの新たなスキル:ANYmalは山登りを学んでいる

ロボット工学の研究者がここ数年で脚付きロボットで成し遂げたことは実に驚くべきことだ。昨年7月、オレゴ...

強力な暗号化アルゴリズムによる SQL インジェクション事例

暗号化には、情報の機密性などさまざまな利点があります。ただし、アプリケーションのセキュリティを確保す...