短時間で理解するHANA Vora入門 概要編
2016.07.28 リアルテックジャパン
RECENT POST 最新記事
RANKING人気記事ランキング
SEARCHブログ内検索
目次
2016.07.28 リアルテックジャパン
弊社の近くにはローソンがあって、よく利用しています。コンビニには弁当・飲料・お菓子など数えきれないほどの商品が陳列されていて、ついつい買い物をしてしまいます。ローソンは、それらの商品を欠品しないようにセミオート発注という手法を使っています。会員データのビッグデータを活用して品揃え、発注数量等を提案する発注方法です。その裏側の仕組はHadoopを活用しています。
HANA Voraに関しては、以前の記事「HANA Voraの基本機能を読み解く~インメモリクエリエンジン他~」も参照ください。SCN記事「SAP HANA Vora 日本語情報まとめ」もわかりやすいです。
そもそもビッグデータにどんな価値があるのでしょうか?ビッグデータの管理はコストもかかりますし、難しい点も多いです。
ひとつの大きなメリットは、新しい価値・発見が見つかる可能性が大きいという点です。ビッグデータを蓄積するだけでなく、統計的な手法を使ってデータ間の関連性や新しい法則などを見つけることが技術的に可能になっています。統計的な手法を使う場合に、データ量が小さいよりも大きい方が発見できることが多いですし、何かを実施するときの効果も大きくなります。このあたりは、過去記事「予測分析(Predictive Analysis)でシステムの価値を高める(前編)」でも解説しています。
Hadoopを速くするためのフレームワークとして、Sparkが登場します。Hadoopでは、ディスクに読み書きしていた処理の途中経過をメモリを使うことによって処理高速化の実現をしています。
2015年にSparkと連携するHANA VoraをSAP社がリリースします。
それぞれとHANAを比較してみました(比較評価は、わかりやすさに重点をおいており正確ではありませんのでご注意ください)。
Ver1.0で時系列に比較してみると似たようなタイミングとなっているのが興味深いです(HadoopやSparkはVer1.0リリースまでの時間がある程度あります)。まるで、ビッグデータ基盤とRDBMSが両方から手を伸ばして、隙間を埋めているように見えます。
次回は「詳細編」です。ご期待ください。