AEROSPIKE CONNECTOR FOR SPARK

データ集約型アプリケーション向けSparkコネクタ

Spark対応のAerospikeコネクタは、高度なApache Spark 3.0ツールにより、AI/MLやETLなどのデータ集約型アプリケーションの作成を可能にします。

エッジとSoRのデータを融合した強力な分析

Sparkとエアロスパイクの大規模並列処理を活用し、インサイトまでの時間を短縮

リアルタイム・トランザクション分析システムは、トランザクション・データとストリーミング・データを、インバウンド・データ・ストリームのように速く動作する単一の高性能データ・プラットフォームに統合する必要があります。また、機械学習や人工知能を含むさまざまなアナリティクスフレームワークと連携する必要もあります。Aerospike Connect for Sparkは、ストリーミングデータと履歴データを組み合わせることでこれらの要件を満たし、組織のリアルタイムな行動を実現します。

Aerospike Connect for Kafka diagram

特徴とメリット

Aerospike Connect for Sparkが選ばれる理由

Aerospike Connect for Sparkは、一般的で使いやすいSparkツールを使用し、AI/ML、ETLなどのデータ集約型アプリケーションの作成を可能にします。

  • リアルタイム・アナリティクス

    Sparkの超並列コンピューティングとエアロスパイクの超並列読み取りを組み合わせることで、インサイトまでの時間を大幅に短縮します。
  • 迅速な開発

    ご希望のSpark対応言語と利用可能な豊富なライブラリを活用することで、エアロスパイクのデータを使ったアナリティクスおよびAI/MLアプリケーションの開発時間を短縮することが可能です。
  • クローズドループのビジネスインサイト獲得

    Connect for Sparkを使用して、トランザクションデータとストリーミングインサイトをデータベースで融合して運用することにより、クローズドループのビジネスインサイトを獲得できます。
  • サーバー設置面積の削減

    膨大なデータセットの分析を可能にしながら、サーバー設置面積を最大80%削減します。
機能

Aerospike Connect for Sparkの主な機能

Aerospike Connect for Sparkは、Structured Spark Streamingを活用するストリーミングAPIに対応し、読み取りと書き込みの両方で非常に低いレイテンシを実現します。これにより、エアロスパイクをSparkストリーミングパイプラインのSoEとして活用するAI/MLのユースケースが実現可能になります。Aerospike Connect for SparkとAerospike Databaseの各パーティションスキャン機能、述語フィルタリング、そしてAerospikeパーティションのSparkパーティションへのマッピングを組み合わせることで、大規模な並列化が可能になります。

DataFrameとDataSetの両方に対応

AerospikeのデータをSpark DataFrameとDataSetsの両方にロードし、SparkMLやPySpark対応のその他のオープンソースライブラリやフレームワークを使用して、ETLやAI/MLなどのSparkでの複雑な処理を可能にします。

Structured Spark Streamingを活用

Structured Spark Streamingを活用して、Aerospikeからのストリーミング読み取り(変更通知)とAerospikeへの書き込みをサポートします。

メインストリーム言語対応

複数の言語に対応可能(Python、Java、Scalaなど)

大規模並列処理に対応

最大32,768のSparkパーティションを使用してAerospikeネームスペースからデータを読み込むことができるため、大規模な並列処理が可能です。各ネームスペースは、4,096パーティションにわたり最大320億レコードを格納することができます。

AerospikeへのSQLアクセスを可能に

Spark SQL(ANSI SQL 2003標準)を活用することで、AerospikeへのSQLアクセスが可能です。

Connect for Sparkの詳細

異種データソース間でリアルタイムに膨大な量のマルチモーダルデータへの高度な予測データ分析を実施することができます。

ソリューション概要を読む
ユースケ―ス

Aerospike Connect for Sparkの代表的ユースケ―ス

Aerospike Connect for Sparkは、企業がAI/MLユースケ―スで何十億ものトランザクションに対してリアルタイムにアクションを実行することを可能にします。

SparkとAerospikeの組み合わせで実現できること

ケーススタディ

世界的なアドテック企業のリアルタイム・オンライン・プロファイル・ストアを強化

データ統合の課題、インフラの複雑さ、Sparkジョブを完了するのに12時間かかることなどをすべて改善

ケーススタディを読む

Aerospike Connectのプロダクトライン