Pages

Friday, November 3, 2023

データレイクとは何ですか? - データレイクと分析の概要 - AWS - amazon.com

データレイクと分析プラットフォームを構築する企業は、いくつかの主な機能について検討する必要があります。以下のような機能があります。

データの移動

データレイクでは、リアルタイムで送信されるデータをいくらでもインポートできます。データは複数の情報源から収集され、元の形式のままデータレイクに移動されます。このプロセスによりデータを任意のサイズにスケールできるようになり、データ構造、スキーマ、変換を定義する時間を節約できます。

データのセキュアな保存とカタログ化

データレイクでは、リレーショナルデータ (運用データベース、および基幹業務アプリケーションからのデータ) と非リレーショナルデータ (モバイルアプリケーション、IoT デバイス、ソーシャルメディア) を保存することができます。また、データのクローリング、カタログ化、インデックス作成によって、どのデータがデータレイクに保存されているかを把握する機能も提供します。さらに、データアセットを保護するためにデータはセキュアである必要があります。

分析

データレイクでは、データサイエンティスト、データデベロッパー、ビジネスアナリストなど、企業内のさまざまな職務を担当するユーザーが、任意の分析ツールやフレームワークを使ってデータにアクセスできます。これには、Apache HadoopPresto、および Apache Spark などのオープンソースフレームワークと、データウェアハウスベンダーおよびビジネスインテリジェンスベンダーからの商用製品が含まれます。データレイクでは、データを別の分析システムに移動させる必要なく分析を実行することができます。

データ分析について読む »

機械学習

データレイクを使用する企業では、履歴データのレポートを作成することや、結果予測モデルを構築する際に機械学習を実施することなどにより、さまざまなタイプのインサイトを生成し、最適な結果を得るための所定のアクションとして幅広い選択肢を提示することができます。

機械学習について読む »

Adblock test (Why?)


からの記事と詳細 ( データレイクとは何ですか? - データレイクと分析の概要 - AWS - amazon.com )
https://ift.tt/4SxY3My

No comments:

Post a Comment