ネットワークが「壊れる前に気づける」仕組みを作ろう
現場で「回線が落ちたのに気づいたのは利用者からのクレームが来てから」という経験、ありませんか? ネットワーク障害は往々にして「突然」起きるように見えますが、実は品質劣化というサインが事前に現れていることが多いです。 IP SLA(IP Service Level Agreements)を活用すれば、回線品質をリアルタイムに計測し、閾値を超えたときに自動でルートを切り替える仕組みが作れます。 今回はCisco機器を例に、IP SLAの基本から実践的な設定まで一緒に見ていきましょう。
IP SLAとは?仕組みをざっくり理解しよう
IP SLAとは、Ciscoルータやスイッチに内蔵されたアクティブモニタリング機能です。 ICMPエコー(pingのようなもの)やUDP、TCPなど様々なプローブを定期的に送信し、遅延・ジッタ・パケットロスといった品質指標を継続的に計測します。
以下が基本的な動作フローです。
- Cisco機器が設定されたプローブを一定間隔で送信する
- 応答結果(RTTやロス率)を内部データベースに記録する
- Threshold(閾値)を超えた場合、SLA違反としてトリガーを発火する
- トリガーに紐づいたTrack オブジェクトの状態(Up/Down)が変化する
- Trackオブジェクトと連動したスタティックルートが有効・無効を切り替わる(フェイルオーバー)
この仕組みにより、物理リンクは生きていても「実質的に通信できない状態」を検知して、自動的に迂回ルートへ切り替えることができます。 BGPやOSPFのような動的ルーティングが使えない環境でも有効なのが大きなメリットですね。
実際の設定例を見てみましょう
シナリオ
以下のような環境を想定します。プライマリ回線(ISP-A)が劣化したら、セカンダリ回線(ISP-B)へ自動切り替えするデュアルホーム構成です。
- プライマリGW:
203.0.113.1(ISP-A) - セカンダリGW:
198.51.100.1(ISP-B) - 監視対象:
8.8.8.8(Googleパブリック DNS)
Step 1:IP SLAプローブの設定
! ICMPエコープローブを定義(ID番号は1)
ip sla 1
icmp-echo 8.8.8.8 source-interface GigabitEthernet0/0
frequency 10 ! 10秒ごとにプローブ送信
timeout 3000 ! タイムアウト3秒(ms単位)
threshold 500 ! RTTが500ms超でSLA違反
ip sla schedule 1 life forever start-time now
Step 2:Trackオブジェクトの設定
! IP SLA 1の結果をTrack 10に紐づける
track 10 ip sla 1 reachability
Step 3:Trackと連動するスタティックルートの設定
! プライマリルート(AD=1):Track 10がUpの間だけ有効
ip route 0.0.0.0 0.0.0.0 203.0.113.1 1 track 10
! セカンダリルート(AD=5):常時設定、プライマリが落ちたときに使われる
ip route 0.0.0.0 0.0.0.0 198.51.100.1 5
Step 4:動作確認コマンド
! SLAの計測結果を確認
show ip sla statistics 1
! Trackオブジェクトの状態確認
show track 10
! ルーティングテーブルの確認
show ip route 0.0.0.0
現場での活用とベストプラクティス
| 設計パターン | 用途・ポイント |
|---|---|
| デュアルホームWAN | スタティックルート+Trackで低コストな冗長化を実現 |
| VoIP品質監視 | UDP Jitterプローブでジッタ・MOS値を継続計測 |
| SNMP連携 | SLA違反をSNMPトラップで監視サーバへ通知 |
| EEM連携 | Trackの状態変化をトリガーにスクリプトを自動実行 |
プローブ先の選び方が最重要です。「監視対象がISP側の問題で落ちた場合」と「自分の機器の問題で落ちた場合」を区別するために、プローブ先はISP内のGWアドレスと外部サーバの両方を設定することをお勧めします。
また、frequencyは短すぎると帯域を圧迫するため、本番環境では10〜30秒程度が現実的な値です。
注意点・よくある落とし穴
- プローブ先がICMPをブロックしている場合:監視先のホストがpingを拒否していると常にSLA違反判定になります。UDPエコーやTCPコネクトプローブへの切り替えを検討しましょう。
- フラッピング(頻繁な切り替わり):閾値を厳しくしすぎると、わずかな品質変動で何度もルートが切り替わります。
delay down/delay upオプションでヒステリシスを設けるのが定石です。 - スケジュール設定の忘れ:
ip sla scheduleを入れないとプローブが動作しません。設定後は必ずshow ip sla statisticsで計測が始まっているか確認してください。 - ASA/NX-OSとの違い:本設定はIOS/IOS-XE向けです。ASAやNX-OSでは構文が異なる場合があります。
まとめ
IP SLAは、シンプルな設定でネットワーク品質の「見える化」と障害時の自動フェイルオーバーを実現できる強力なツールです。 特にスタティックルート環境やコスト制約のある拠点では、動的ルーティングの代替として非常に有効です。 まずはGNS3やCML(Cisco Modeling Labs)などのシミュレータで動作を確かめてみてください。 「回線が死んでから気づく」運用から「品質が落ちる前に自動対処できる」運用へ、一歩踏み出してみましょう。
```