短時間で理解するHANA Vora入門詳細編

公開日: 2016.07.28 更新日: 2026.05.18

リアルテックジャパン株式会社　技術チーム

HANA Voraの位置づけ

実は、HANA VoraはSAPのプラットフォーム戦略上も核となる位置づけになっています(SAPPHIRE 2016資料 P21参照)。図上ではHANAと同格なほどです。
HANA Vora概要について前回記事「短時間で理解するHANA Vora入門概要編」で解説しました。今回はその後編として、HANA Vora基本動作と特長について説明します。

SAPユーザー必見！テスト・トレーニング・データ移行時に機密データを守る方法は？

HANA Vora基本動作(テーブル定義、メモリロードからクエリ実行)

まずはHANA VoraのシェルをSSHクライアントから起動します。

YARNモードでシェルを起動したため、YARNでSpark Executorが見えます。この動きおよび見え方はSparkと変わりがありません。

では、HANA Voraでテーブル定義をし、HDFSに置いている1GBのファイルをロードします。データが3つのノードに分散されてメモリロードされているのがわかります。

クエリを実行してみます。クエリ結果がシェル画面で見えます(実際にはエンドユーザは使わない画面ですが、技術者が簡易的に結果確認ができます)。

実行処理をSparkのUIで見ることができます。上画面ショットはJob単位のログで、下画面ショットはStage単位のログです。Stageのレベルで見ると処理が分散されているのがわかります。

これまでの動きを画面を通して見るとわかりますが、HANA VoraはSpark、YARNと協調して動きます。

データ移行とは？基本から徹底解説｜失敗しないための手順とポイント

HANA Voraの特長

HANA Voraの特長は大きく以下の3つです。

1. OLAP機能強化

企業向けOLAP機能として階層構造を定義したり、キューブ、ディメンションタイプのViewを定義することができます。

前者は、組織や品目などを階層構造を使ってレポーティングするための機能です。リンク先動画にわかりやすく紹介されています。

後者は、レポートでインタラクティブにドリルダウンをするために使用できます。ShellやHANA Vora ToolからSQL(DDL)で定義できます。また、リンク先記事でも紹介されているようにモデラーツールでも定義できます。

2. HANA連携

HANA VoraとHANAで双方向に連携できます。先の記事で紹介したローソン事例のような、基幹システムと(HANA Voraではありませんが)ビッグデータを連携する場合には、威力を発揮します。双方向連携なので、HANAを主軸とする使い方もHadoop/Sparkを主軸とする使い方も可能となります。

HANAからSpark/Hadoopへの連携では、Smart Data Access(以下、SDA)という機能がありました。簡単に言うとSmart Data Accessよりも速く安定した連携が可能となります。SDAはODBC/JDBCドライバに依存していたり、Hadoopディストリビューション間で互換性がないといった問題がありました。それに対して、HANA VoraではSAP製のSpark Controllerというコンポーネントを通すことでスピードと安定性を担保しています。

3. Spark高速化

HDFS上のデータをカラムストア化してメモリ上に展開することで、読込処理の高速化が実現できます。インメモリ処理とカラムストアはHANAで実装されているC++のコードをベースに実装しています。

では、どれだけ処理高速化が実現できるのでしょうか？Sparkと処理時間の比較してみました。

単一テーブルに対する処理は非常に速いです。Joinの場合はあまり変わらなくなってしまっています。用途に応じてHANA Voraを活用する領域を考慮する必要が多そうです。

「3. Spark高速化」の検証詳細

検証環境

下図のバージョンをノードの基本構成にして Amazon EC2 上に構築しています。クラスタマネージャとして YARN を使用し、データストレージに HDFS を使い同居させています。

Hadoopディストリビューション

HDP2.3.4

クラスタマネージャ

YARN(Spark/HANA VoraをYarnで実行)
HDFSと同居

データストレージ

HDFSにCSV形式
YARNと同居

Spark(HANA Vora)実行時パラメータ

クラスタ全体のExecutor数：12
ExecutorあたりのCore数：4
Executorあたりのメモリ割当：12GB

テストデータ

テストデータはAWSのツールを使いました(Impala用とありますが、Spark/ HANA Voraでも使用可能です)。

Transactionを47GB(約10億レコード)、booksを1GB(約1000万レコード)で作りました。

実行クエリ

クエリは以下の条件で実行しています。

HANA Voraの今後

HANA VoraはHANAをはじめとするRDBMSと比べて歴史が浅く、発展の余地が多々ある領域です。今後、既存機能の強化とともに、時系列データ・グラフエンジンなどHANAの機能がHANA Voraにも盛り込まれていく予定です。ぜひとも期待したいものです！

【本記事の監修体制について】

執筆：Professional Service 部

監修：リアルテックジャパン株式会社 SAPソリューション事業

この記事は、SAP導入プロジェクトの豊富な経験を持つ当社の専門部門が内容を精査し、以下の最終承認プロセスを経て公開しています。

最終監修責任者：リアルテックジャパン株式会社代表取締役社長松浦一哉

企業の代表として、お客様の課題解決に繋がる有益で正確な情報発信に責任を持って取り組んでまいります。

リアルテックのブログ一覧会社概要はこちら

この記事に関するサービスのご紹介

導入／移行(プロフェッショナル)サービス

プロフェッショナルサービスでは主にSAPシステムの導入や移行、それに伴うテクニカルな支援を行います。ERPやS/4　HANA、SolManといった様々なSAP製品の新規導入、クラウドを含む様々なプラットフォームへのSAPシステムの最適な移行、保守切れに伴うバージョンアップ・パッチ適用等の作業だけでなく、パラメータ設計、パフォーマンスチューニング、導入・移行計画支援等についても対応いたします。

詳細はこちら

短時間で理解するHANA Vora入門詳細編

HANA Voraの位置づけ

HANA Vora基本動作(テーブル定義、メモリロードからクエリ実行)