HANAで実現するスマートな時系列情報管理(Time Series Data)

 2016.01.25  リアルテックジャパン

時系列データ(Time Series Data)とは

昨年末から年初にかけて株価の変動が激しいですね。株取引をしない方でもニュースで株価チャートを見たことはあるかと思います。横軸に時間、縦軸に株価を表示している折れ線グラフです。株価のように時間の経過とともに変化する情報を時系列データと呼びます。

「theGuard! SmartChange Transport Management」 導入
SAPシステムパフォーマンス分析パック

IoTが流行の今、機器の温度データ、カウンター情報など時系列データを取り扱うことが非常に増えてきました。HANAでは時系列データを扱うにおいて関するいくつかの付加機能があります。今回はHANAと時系列データ管理の紹介です。

重いデータを高圧縮

時系列データは量が多いのが一般的な特徴です。例えば、自社工場内の機器に取り付けたセンサーから温度情報を保存する場合(参考記事: HANAとRaspberry Piをつなげてみた(SAPとオープンな世界))、「計測回数/日×機器数」レコードだけ1日に増えます。1分ごとの計測で機器が1000ある場合では、約150万件のレコードが1日ごとに増加します。

HANAはこの重くなりがちなデータを特有の圧縮アルゴリズムを用いて高圧縮します。圧縮のアルゴリズムを単純に示すと下図ようになります(わかりやすいよう単純化しているので正確ではありません)。日時の値をすべて持つのではなく、最初の値とのオフセットで持つことで高圧縮を実現しています。

TimeSeriesCompress.jpg実際に通常のテーブルと時系列データオプションを使ったテーブルとでデータサイズ(メモリサイズ)を比較してみました。約800万レコードを保存しています。

TimeSeriesSize.jpg上の図で分かる通り、圧倒的な圧縮率(約0.1%以下)です(カラムストアなので項目ごとのメモリ量を示しています)。

通常:65MB

時系列:10KB

日付の丸め処理

日付に関してはSERIES_ROUNDという機能を使って丸め処理を簡単に表現できます。下図のようなイメージです(15分単位で丸めています)。詳しくはヘルプポータルを参照ください。

TimeSeriesRound.jpg

分析機能

SQLで手軽に加重移動平均を求めたり、将来値を予測をしたりすることもできます。センサーから取得した値が予測値と大幅に乖離していた場合に、アラートを出すなどの用途で使います。
下図は移動平均と予測のイメージです。オレンジの点線は移動平均、青の点線は予測値のイメージを示しています。

TimeSeriesAnalysis.jpg

分析機能の使い方などはヘルプポータルを参照ください。

インダストリー4.0などへ

時系列情報活用はインダストリー4.0など、より高度な経営・業務を実現していく上で欠かすことができない要素です。その高度な経営・業務を実現する上で、速く少ないコストで仕組を構築するためにHANAの時系列データ管理を活用できるケースが多いはずです。

SAPユーザのための 『S/4HANA』データ移行

RECENT POST「S/4HANA」の最新記事


この記事が気に入ったらいいねしよう!
Archive Migration Service (アーカイブ移行リモートサービス)
オフィシャル採用ブログ『RTFrontier』はこちらから!

RANKING人気資料ランキング

RECENT POST 最新記事

RANKING人気記事ランキング

ブログ購読のお申込み