Publications

JOURNAL (DOMESTIC) 時系列障害原因分析による推論QoS規則導出手法

今野 賢 (ヤフー株式会社,北陸先端科学技術大学院大学), デファゴ クサヴィエ (東京工業大学), 冨田 尭 (北陸先端科学技術大学院大学), 井口 寧 (北陸先端科学技術大学院大学)

情報処理学会論文誌 デジタルプラクティス

July 15, 2021

クラウド環境におけるQoS(Quality of Service)保証はサービス利用者と提供者の両者に共通する重要な課題である.特に障害発生時の運用作業においては調査時間も限られ運用者の介在による遅延も発生し,即時の障害復旧には運用業務の自動化が不可欠である.本稿は,近年顕著である時系列監視データベースのインメモリへの移行動向に適した,実時間で動作可能な事例ベース推論と時系列形状ベースの障害原因分析に基づいたイベント駆動型の推論QoS監視規則生成手法を提案する.本提案手法の適用により,障害発生時の即時の暫定的復旧対応に加え,再発防止に向けた障害原因特定および恒久的対処の自動化を目的とする.本提案手法は評価実験にて,従来の時系列クラスタリング手法と比較して同等の高適合率を保ちつつ,実時間で高速に動作する障害原因分析性能を示した.また現実的障害環境下での即時の自律復旧対策による有用性も示した.

Paper : 時系列障害原因分析による推論QoS規則導出手法 (external link)