短時間で理解するHANA Vora入門 概要編

 2016.07.28  リアルテックジャパン

コンビニのセミオート発注

弊社の近くにはローソンがあって、よく利用しています。コンビニには弁当・飲料・お菓子など数えきれないほどの商品が陳列されていて、ついつい買い物をしてしまいます。ローソンは、それらの商品を欠品しないようにセミオート発注という手法を使っています。会員データのビッグデータを活用して品揃え、発注数量等を提案する発注方法です。その裏側の仕組はHadoopを活用しています。

「theGuard! SmartChange Transport Management」 導入
SAPシステムパフォーマンス分析パック
今回は、ローソンにも利用されているビッグデータ基盤としてHadoop、そしてHadoopと連携するSparkおよびHANA Voraの入門解説をします。この記事の後に 「詳細編」へと続きます。

HANA Voraに関しては、以前の記事「HANA Voraの基本機能を読み解く~インメモリクエリエンジン他~」も参照ください。SCN記事「SAP HANA Vora 日本語情報まとめ」もわかりやすいです。

ビッグデータの価値

そもそもビッグデータにどんな価値があるのでしょうか?ビッグデータの管理はコストもかかりますし、難しい点も多いです。

ひとつの大きなメリットは、新しい価値・発見が見つかる可能性が大きいという点です。ビッグデータを蓄積するだけでなく、統計的な手法を使ってデータ間の関連性や新しい法則などを見つけることが技術的に可能になっています。統計的な手法を使う場合に、データ量が小さいよりも大きい方が発見できることが多いですし、何かを実施するときの効果も大きくなります。このあたりは、過去記事「予測分析(Predictive Analysis)でシステムの価値を高める(前編)」でも解説しています。

Hadoop、Spark、HAVA Voraの歴史

まずはHadoop、Spark、HAVA Voraを順に説明していきます。
Hadoopはビッグデータ処理を支えるオープンソースのフレームワークです。2006年にVer0.1がリリースされ、Yahooを筆頭にして多くの企業で利用されています。

Hadoop Overview.jpg

Hadoopを速くするためのフレームワークとして、Sparkが登場します。Hadoopでは、ディスクに読み書きしていた処理の途中経過をメモリを使うことによって処理高速化の実現をしています。

Spark Overview.jpg

2015年にSparkと連携するHANA VoraSAP社がリリースします。

HANA Vora Overview.jpg

それぞれとHANAを比較してみました(比較評価は、わかりやすさに重点をおいており正確ではありませんのでご注意ください)。
Hadoop Spark Vora HANA Compare.jpg

Ver1.0で時系列に比較してみると似たようなタイミングとなっているのが興味深いです(HadoopやSparkはVer1.0リリースまでの時間がある程度あります)。まるで、ビッグデータ基盤とRDBMSが両方から手を伸ばして、隙間を埋めているように見えます。
Hana Voras history.jpg

三者択一ではなく組み合わせ

今回は、ビッグデータ基盤としてのHadoop、Spark、HANA Voraの概要を説明しました。三者択一ではなく、それぞれを組み合わせて活用できます。それらは、あくまでフレームワークなので、その上に何を作るかは創造力が試されます。ローソンのように発注と組み合わせる方法もあるでしょう。今回の解説が活用における一助になれば幸いです。

次回は「詳細編」です。ご期待ください。

SAPユーザのための 『S/4HANA』データ移行

RECENT POST「S/4HANA」の最新記事


この記事が気に入ったらいいねしよう!
Archive Migration Service (アーカイブ移行リモートサービス)
オフィシャル採用ブログ『RTFrontier』はこちらから!

RANKING人気資料ランキング

RECENT POST 最新記事

RANKING人気記事ランキング

ブログ購読のお申込み