データレイクハウスについて知っておくべき5つのこと

Tom Merrittが、データレイクハウスがデータウェアハウスとデータレイクの両方の長所をどのように提供しようとしているのかを説明します。
データはクラウドに存在せず、クラウドを通過するだけです。実際、データを雨に降らせて湖を形成し、データウェアハウスと組み合わせるとレイクハウスになる可能性があります。これらの文章があなたにとって意味のあるものである場合は、このトップ5を理解していない同僚に送ってください。
データレイクハウスについて知っておくべき5つのことを次に示します。
1。 データウェアハウスとは何ですか?通常、構造化データのホームを指します。質問がある場合は、データウェアハウスで答えを見つけることができます。
2。 データレイクとは何ですか?これは基本的に、重要と思われるデータをスローする場所ですが、それをどう処理するかがわかりません。データをウェアハウスに実行するか、機械学習アルゴリズムに直接送信することができます。
3。 データレイクハウスはあなたに両方の長所を提供しようとします。データレイクのように簡単で低コストです。また、データウェアハウスがなくても、データウェアハウスなどの質問に答えられるという利点がいくつかあります。
4。 データレイクハウスの鍵はメタデータレイヤーです。Delta Lakeのようなオープンソースレイヤーはファイルを追跡し、ストリーミングI / O、データ検証などをサポートします。
5。 データレイクハウスが増加しています。Ventanaの調査によると、73組織の%は、データレイクとデータウェアハウスを組み合わせています。データレイクハウスは、S3、HDFSなどの既存のシステムの上に構築できます。
このトップ5に取り組んでいる間、オートコレクトアルゴリズムは、レイクハウスをベイクハウスに変更し続けました。これは、データベイクハウスがデータ分析の次の進化になることを意味すると思います。
トムメリットのビジネスプロ向けの最新の技術アドバイスについては、YouTubeのTechRepublicトップ5に登録してください。
データ、分析とAIニュースレター
データサイエンス、ビッグデータ分析、人工知能に関する最新のニュースとベストプラクティスを学びます。月曜日に配信
今日サインアップする
も参照してください