IP SLAを活用したネットワーク品質監視と経路フェイルオーバーの自動化

```html

ネットワークが「壊れる前に気づける」仕組みを作ろう

現場で「回線が落ちたのに気づいたのは利用者からのクレームが来てから」という経験、ありませんか? ネットワーク障害は往々にして「突然」起きるように見えますが、実は品質劣化というサインが事前に現れていることが多いです。 IP SLA(IP Service Level Agreements)を活用すれば、回線品質をリアルタイムに計測し、閾値を超えたときに自動でルートを切り替える仕組みが作れます。 今回はCisco機器を例に、IP SLAの基本から実践的な設定まで一緒に見ていきましょう。

IP SLAとは?仕組みをざっくり理解しよう

IP SLAとは、Ciscoルータやスイッチに内蔵されたアクティブモニタリング機能です。 ICMPエコー(pingのようなもの)やUDP、TCPなど様々なプローブを定期的に送信し、遅延・ジッタ・パケットロスといった品質指標を継続的に計測します。

以下が基本的な動作フローです。

  • Cisco機器が設定されたプローブを一定間隔で送信する
  • 応答結果(RTTやロス率)を内部データベースに記録する
  • Threshold(閾値)を超えた場合、SLA違反としてトリガーを発火する
  • トリガーに紐づいたTrack オブジェクトの状態(Up/Down)が変化する
  • Trackオブジェクトと連動したスタティックルートが有効・無効を切り替わる(フェイルオーバー)

この仕組みにより、物理リンクは生きていても「実質的に通信できない状態」を検知して、自動的に迂回ルートへ切り替えることができます。 BGPやOSPFのような動的ルーティングが使えない環境でも有効なのが大きなメリットですね。

実際の設定例を見てみましょう

シナリオ

以下のような環境を想定します。プライマリ回線(ISP-A)が劣化したら、セカンダリ回線(ISP-B)へ自動切り替えするデュアルホーム構成です。

  • プライマリGW:203.0.113.1(ISP-A)
  • セカンダリGW:198.51.100.1(ISP-B)
  • 監視対象:8.8.8.8(Googleパブリック DNS)

Step 1:IP SLAプローブの設定

! ICMPエコープローブを定義(ID番号は1)
ip sla 1
 icmp-echo 8.8.8.8 source-interface GigabitEthernet0/0
 frequency 10          ! 10秒ごとにプローブ送信
 timeout 3000          ! タイムアウト3秒(ms単位)
 threshold 500         ! RTTが500ms超でSLA違反
ip sla schedule 1 life forever start-time now

Step 2:Trackオブジェクトの設定

! IP SLA 1の結果をTrack 10に紐づける
track 10 ip sla 1 reachability

Step 3:Trackと連動するスタティックルートの設定

! プライマリルート(AD=1):Track 10がUpの間だけ有効
ip route 0.0.0.0 0.0.0.0 203.0.113.1 1 track 10

! セカンダリルート(AD=5):常時設定、プライマリが落ちたときに使われる
ip route 0.0.0.0 0.0.0.0 198.51.100.1 5

Step 4:動作確認コマンド

! SLAの計測結果を確認
show ip sla statistics 1

! Trackオブジェクトの状態確認
show track 10

! ルーティングテーブルの確認
show ip route 0.0.0.0

現場での活用とベストプラクティス

設計パターン 用途・ポイント
デュアルホームWAN スタティックルート+Trackで低コストな冗長化を実現
VoIP品質監視 UDP Jitterプローブでジッタ・MOS値を継続計測
SNMP連携 SLA違反をSNMPトラップで監視サーバへ通知
EEM連携 Trackの状態変化をトリガーにスクリプトを自動実行

プローブ先の選び方が最重要です。「監視対象がISP側の問題で落ちた場合」と「自分の機器の問題で落ちた場合」を区別するために、プローブ先はISP内のGWアドレスと外部サーバの両方を設定することをお勧めします。 また、frequencyは短すぎると帯域を圧迫するため、本番環境では10〜30秒程度が現実的な値です。

注意点・よくある落とし穴

  • プローブ先がICMPをブロックしている場合:監視先のホストがpingを拒否していると常にSLA違反判定になります。UDPエコーやTCPコネクトプローブへの切り替えを検討しましょう。
  • フラッピング(頻繁な切り替わり):閾値を厳しくしすぎると、わずかな品質変動で何度もルートが切り替わります。delay down/delay upオプションでヒステリシスを設けるのが定石です。
  • スケジュール設定の忘れip sla scheduleを入れないとプローブが動作しません。設定後は必ずshow ip sla statisticsで計測が始まっているか確認してください。
  • ASA/NX-OSとの違い:本設定はIOS/IOS-XE向けです。ASAやNX-OSでは構文が異なる場合があります。

まとめ

IP SLAは、シンプルな設定でネットワーク品質の「見える化」と障害時の自動フェイルオーバーを実現できる強力なツールです。 特にスタティックルート環境やコスト制約のある拠点では、動的ルーティングの代替として非常に有効です。 まずはGNS3やCML(Cisco Modeling Labs)などのシミュレータで動作を確かめてみてください。 「回線が死んでから気づく」運用から「品質が落ちる前に自動対処できる」運用へ、一歩踏み出してみましょう。

```