LASSIC Media らしくメディア
システム24時間監視を外注する費用と体制の選び方
LASSIC IT事業部|元請(プライムベンダー)としてシステム保守・運用を受託
この記事のポイント
- 24時間監視の費用は体制形態(常時有人か夜間休日のみか)によって大きく変わります
- 監視対象は死活・リソース・ログ・アプリ・セキュリティの5層に整理し、優先度を決めてから外注範囲を設定することが大切です
- SLAとエスカレーション設計が外注成否のカギとなります。「24時間365日対応」という表現の実態は業者によって異なるため、契約前の確認が欠かせません
目次
24時間システム監視の外注とは――5層の監視対象と体制の全体像
システムの24時間監視外注とは、自社運用担当者が夜間・休日・深夜を含む全時間帯にわたって行う監視業務を、専門の運用保守事業者に委託する形態を指します。単に「アラートを受け取る仕組み」を構築するだけでなく、障害発生時の一次対応・エスカレーション・状況報告までを含めた一連の対応フローを外部に委ねる点が特徴です。
監視の対象は「死活監視・リソース監視・ログ監視・アプリケーション監視・セキュリティ監視」の5層で構成されます。どの層をどの体制で外注するかによって、費用と対応品質が大きく変わります。まず全体像を把握したうえで、自社システムに必要な監視範囲を整理することが外注設計の出発点になります。
運用責任者にとって重要なのは、5層すべてを外注する必要はないという点です。事業継続上の優先度が高い層から外注範囲を決め、コストとカバレッジのバランスを取る設計が実務的です。
監視対象の5種類と外注範囲の決め方
①死活監視――稼働確認の基本
死活監視は、対象サーバやネットワーク機器にPINGを送り、応答の有無でシステムが稼働しているかを確認する手法です*1。監視の出発点となる1層目で、ほぼすべての外注監視サービスに標準で含まれています。
費用は比較的低く抑えられますが、「応答はあるが処理は止まっている」状態は検知できません。死活監視だけで外注を完結させると、アプリケーション層の障害を見落とすリスクがあります。
②リソース監視――性能劣化の予防
CPU使用率・メモリ消費量・ディスク残量・ネットワーク帯域などのリソース状況を継続的に取得し、閾値超過でアラートを発行します*1。サーバダウンに至る前の予兆を検知できるため、障害予防の役割を担います。
外注先によっては、閾値の設定・チューニングを含む「運用設計込み」プランと、アラート通報のみの「監視専従」プランに分かれます。初回契約時に範囲を明確にしておくことが大切です。
③ログ監視――異常の早期発見
OSやミドルウェア、アプリケーションが出力するログを収集し、異常を示すキーワードが含まれる行を検出する監視です*1。エラーログ・セキュリティログ・アクセスログなど種類が多く、監視ルールの設計が煩雑になりがちです。
外注先の技術力がログ監視の品質に直結します。業界ごとの典型的なエラーパターンを知る事業者を選ぶと、誤検知や見落としを減らせます。
④アプリケーション監視――業務影響の直接検知
サーバ上で稼働するプロセスやサービスの状態を監視し、Webサーバ・DBサーバ・バッチ処理などが正常に動作しているかを確認します*1。エンドユーザーが感じる「業務が止まった」状態に最も近い監視です。
合成監視(シナリオを定期実行して画面応答を確認する手法)と組み合わせることで、実ユーザーの体験に近い観点で監視できます。
⑤セキュリティ監視――専門性が要求される上位層
不正アクセス・マルウェア感染・異常通信などのセキュリティインシデントを検知する監視です。SOC(Security Operation Center)と呼ばれる専門組織が担うことが多く、死活・リソース監視より高度な知識が必要です。
一般の運用監視サービスとは料金体系が異なる場合が多く、別途SOCサービスとして契約するケースもあります。コスト計画の段階で分けて試算することをお勧めします。
常時有人監視と夜間休日のみ――体制形態の違いと費用への影響
「24時間監視の外注」と一口に言っても、実態は体制形態によって大きく異なります。外注形態は大きく3つに分類できます。
| 体制形態 | 概要 | 費用水準 | 向いているシステム |
|---|---|---|---|
| 常時有人監視 | 24時間365日、オペレーターが常駐して監視・一次対応を行います。 障害発生時に即時の判断・連絡・応急処置が可能です。 |
最も高コスト。 後述の費用試算を参照してください。 |
EC・金融・医療・基幹系など、深夜帯の障害が事業損失に直結するシステムに向いています。 |
| 夜間・休日のみ有人監視 | 平日日中は自社で対応し、夜間・休日のみ外注先に委託します。 ハイブリッドな体制として採用されることが増えています。 |
常時有人の6〜7割程度が目安(市場参考値・一次資料ではありません)。 | 内部系システム・社内ポータルなど、深夜トラフィックが少ないが無人にはできないシステムに向いています。 |
| アラート通報+オンコール | 監視ツールが自動でアラートを送信し、重大障害時のみ担当者がオンコールで対応します。 常時有人ではなく、緊急時の人的対応を保証する形態です。 |
コストを抑えやすい形態です。 オンコール呼び出し料が別途加算される場合があります。 |
障害頻度が低い安定稼働のシステムや、一次対応は自動化で賄えるシステムに向いています。 |
重要なのは、「24時間365日対応」という表現の実態が業者によって大きく異なる点です。ある業者では「自動監視ツールが24時間稼働し、アラートをメール送信する」だけを指し、有人対応は保証されていないケースもあります。
契約前に「夜間・休日の障害発生時に、何分以内にどの担当者が電話口に出るか」を具体的に確認することが欠かせません。
24時間監視を外注したときの費用の考え方
内製化コストの試算と外注費用の比較
自社で24時間365日の監視体制を内製で維持しようとすると、交代制勤務のために最低5名程度の体制が必要になります*2。月間720時間(24時間×30日)をカバーするには、引き継ぎ時間を含めると750時間程度の監視工数が必要で、時給換算の人件費だけで月額200万円超の試算が示されています*2。
夜勤・休日出勤の割増手当、採用・教育コストを加えると、月額300万円台に達することも珍しくありません。これに対し、外注サービスでは月額80〜120万円程度のレンジが参考値として示されています(市場参考値・一次資料ではありません)*3。
常時有人監視と夜間休日のみの費用差
外注費用は体制形態によって異なります。常時有人監視は、専任オペレーターが24時間常駐するため、費用は高くなります。夜間・休日のみの委託は、平日日中を自社で担当する分だけ外注コストを圧縮できます。
監視対象の台数・サービス・エスカレーション範囲によって個別の見積もりが変わるため、複数の事業者に要件を提示して相見積もりを取ることを強くお勧めします。「費用相場」として固定した数値が一人歩きしやすいテーマですが、実際の契約金額は自社の監視要件次第です。
費用を左右する主な変動要因
- 監視対象ノード数・サービス数:台数が増えるほど費用も増加します
- 体制形態:常時有人か夜間休日のみかで大きく変わります
- 一次対応の有無:アラート通報のみか、切り分けや応急処置まで含むかで費用が変わります
- オンコール対応要否:緊急時のオンコール呼び出し料が加算される場合があります
- 接続方式:VPN・L2接続などセキュアな接続が必要な場合は初期費用が加わります
- SLAの厳しさ:応答・復旧時間の保証水準を上げるほど費用は上がります
費用の考え方として参考になるのが、アイティーエム株式会社が公表しているサービス価格体系です。監視パック単体の月額は数千円台からですが、24時間365日の障害対応を含む上位プランでは月額数万円台(1ノードあたり)になります*4。台数が多いシステムでは積み上げ計算が必要です。
SLAとエスカレーション設計――外注成否を左右する契約の核心
SLAに定めるべき主要項目
SLA(Service Level Agreement)とは、サービス提供者と委託者の間で合意するサービス品質の基準値を定めた契約文書です。24時間監視の外注においては、以下の項目を数値で明記することが実務上重要です*5。
- 可用性・稼働率:「99.9%以上」などの年間・月間稼働率
- 障害通知の初報時間:障害検知から何分以内に連絡するか
- ワークアラウンド対応時間:障害発生から応急処置着手まで何分以内か
- 障害復旧目標時間(RTO):正常復旧を目指す時間軸
- サービス要求への応答時間:問い合わせや作業依頼への回答時間
- SLA未達時の補償方法:現金返金かサービスクレジットか
「24時間365日対応」という一般的な表現は「何をどこまでやるか」を明示しません。「電話受付あり」「一次切り分けあり」「実作業着手あり」でそれぞれ意味が異なります*5。SLAに夜間・休日の実作業着手の有無を明記させることが、後のトラブルを防ぎます。
エスカレーション設計の基本構造
エスカレーション設計とは、障害の深刻度に応じて通知先・対応レベル・タイムアウトを段階的に定める仕組みです。適切に設計することで、軽微な障害への過剰反応と、重大障害への対応遅延の両方を防げます。
優先度は一般的に4段階で設計します。P1(緊急・サービス全停止)ではオンコール呼び出しから経営層への即時連絡まで発動させます。P2(重要機能の停止)ではリーダーへ30分以内通知、P3(部分的な機能低下)では翌業務時間内対応、P4(軽微な表示崩れ等)は翌日対応、というように優先度別に基準を設けます*5。
エスカレーション先として、一次担当(外注オペレーター)→二次担当(外注上位エンジニア)→三次担当(発注側の運用責任者)→四次担当(経営・情報システム部門長)という連絡チェーンを契約書に明記します。発注側の緊急連絡先(携帯番号含む)を外注先に登録するとともに、外注先の夜間担当の直通連絡先も確認しておく必要があります。
外注先選定で確認すべき5つのポイント
ポイント1:「24時間365日」の実態を確認する
最初に確認すべきは、「24時間対応」の実態です。自動監視ツールがアラートを発するだけなのか、有人でアラートを受けて初期対応まで行うのかを明確にします。夜間・休日の問い合わせ窓口が実際につながるかを試しに電話確認する企業もあります。
ポイント2:監視対象と技術スタックへの対応力
自社システムがオンプレミス・クラウド(AWS・Azure・GCPなど)・ハイブリッドのどの構成かによって、対応できる外注先が変わります。クラウドネイティブなシステムには、クラウド特有のメトリクス(CloudWatchやAzure Monitorなど)を扱える事業者が適しています。
ポイント3:セキュリティ基準と情報管理体制
監視業務では、外注先がサーバに接続してログを確認する必要があります。ISO 27001(情報セキュリティマネジメントシステム)やISMS認証の取得状況を確認するとともに、VPNやアクセス権限の管理方針・NDAの締結内容を精査します。
ポイント4:インシデント報告書の品質
障害後の報告書(インシデントレポート)の質は外注先によって大きく異なります。発生時刻・検知時刻・対応内容・根本原因の分析・再発防止策まで記載するレポートを提供できるか、過去の報告書サンプルを事前に確認することをお勧めします。
ポイント5:解約・移管時のデータ返却条件
契約終了時に、監視設定・ログデータ・認証情報・手順書がどのような形式で返却されるかを事前に確認します。返却範囲が曖昧なまま契約すると、解約後に新しい外注先への移管作業が困難になります*5。契約書に「返却物一覧」を別紙で明記させることが移管リスクを下げます。
内製を続けるリスクと外注移行の進め方
内製24時間体制が抱えるリスク
自社で24時間365日の監視体制を維持する場合、特定の担当者への依存リスクが生じます。担当者の退職・異動・病欠が発生すると、監視品質が一気に低下します。
人員補充のためには新たな採用が必要ですが、インフラ運用・監視ツールの経験者は採用市場で不足しており、採用から実務着任まで半年から1年規模のリードタイムを要することも珍しくありません。深夜・休日勤務に対応できる人材は限られており、継続的な運用体制の維持は難易度が上がっています。
また、担当者が監視業務に拘束されることで、システム改善・自動化・新規開発への時間が割けなくなる機会コストも見落とせません。
外注移行の進め方――3つのステップ
外注移行を円滑に進めるには、段階的な移管が実務的です。
- 現状の監視設計の文書化:現在行っている監視項目・アラート閾値・エスカレーションフローを一覧化します。運用手順書がない場合は、まずこの文書化から着手します。
- 並走期間の設定:自社運用を続けながら外注先とともに監視を行う並走期間(1〜3か月程度)を設けます。この間にアラートの誤検知調整・エスカレーションフローの確認・報告書フォーマットの合意を行います。
- 切り替えと定期レビュー:並走期間を経て外注に完全移行した後は、月次・四半期でのレビュー会議を設け、SLAの達成状況・改善要望を継続的に共有します。
外注移行後も「丸投げ」にならないよう、自社側に窓口担当者を置き、外注先との情報連携を維持することが長期的な品質維持につながります。
外注で担えない判断は自社が持つ
外注先が担えるのは、事前に合意した範囲内の監視・対応です。「このエラーは業務上許容できるか」「このアラートはシステム変更の影響か」といった業務判断は、システムを知る自社側にしかできません。外注活用を前提にした場合でも、業務影響を判断できる担当者が社内に必要です。
まとめ:体制形態・費用・SLA――外注判断の3つの軸
本稿では、システムの24時間監視外注について、監視対象の5層・体制形態の違い・費用の考え方・SLA設計・外注先選定の実務ポイントを整理しました。要点を3つに集約すると次の通りです。
第一に、監視対象を死活・リソース・ログ・アプリ・セキュリティの5層で整理し、事業影響の大きい層から優先的に外注範囲を設定することが費用対効果を高めます。第二に、体制形態(常時有人・夜間休日のみ・オンコール型)によって費用水準は大きく変わります。自社システムの事業継続要件に合わせた形態の選択が費用最適化の出発点です。第三に、SLAと優先度別エスカレーション設計を契約に明記することが外注品質の担保につながります。「24時間365日対応」という表現の実態を確認せずに契約すると、障害時に期待した対応が得られないリスクがあります。
費用はシステム規模・監視対象台数・体制形態・一次対応の範囲によって個別に変わります。複数の事業者に要件を提示して相見積もりを取ることで、自社の要件に最適なコストと体制を見極められます。
よくある質問
システムの24時間監視を外注すると、費用はどのくらいかかりますか。
費用はシステム規模・監視対象台数・体制形態(常時有人か夜間休日のみか)・一次対応の範囲によって大きく異なります。外注サービスの費用参考値として月額80〜120万円程度が示されているケースもありますが(市場参考値・一次資料ではありません)、小規模システムでは監視ノード単位の積み上げにより数万円台から契約できるサービスも存在します。自社の要件を整理したうえで、複数の事業者から相見積もりを取ることが費用を見極める実践的な方法です。
常時有人監視と夜間休日のみの監視では、どちらが費用対効果が高いですか。
事業継続への影響度で判断することが実務的です。深夜帯のトラフィックが高く、障害が売上損失や顧客信頼に直結するシステム(ECサイト・金融系・医療系など)では常時有人監視が合理的です。一方、深夜のアクセスが少ない社内システムや内部管理系では、夜間・休日のみの外注でコストを抑えながら必要なカバレッジを確保できます。システムの事業影響度と稼働パターンを整理してから形態を選択することをお勧めします。
外注先の「24時間365日対応」という表現は信頼できますか。
「24時間365日対応」という表現の実態は業者によって異なるため、そのままでは比較基準になりません。「自動監視ツールのアラートをメール送信する」だけを指すケースから、「オペレーターが常駐して一次対応まで行う」ケースまで幅があります。契約前に「夜間・休日の障害発生時に、何分以内に有人対応が始まるか」「電話でつながるか」を具体的に確認し、SLAに数値で明記させることが大切です。
監視の外注先に5層すべてを任せるべきですか。
すべての層を外注しなければならないわけではありません。事業影響の大きい層(死活・リソース監視)から外注範囲を設定し、セキュリティ監視は専門のSOCサービスと別契約にするなど、層ごとに委託先・委託範囲を分ける設計も有効です。外注範囲を広げるほど費用は上がるため、自社システムのリスク評価をもとに優先順位をつけることが費用対効果の向上につながります。
外注に移行した後、自社側にはどのような体制が必要ですか。
外注先との窓口担当者を自社に置くことが大切です。「このアラートは業務上許容できるか」「このエラーはシステム変更の影響か」といった業務判断は、システムを知る自社担当者にしかできません。外注先からのエスカレーション受け先として、夜間・休日も含めた緊急連絡先を登録しておくとともに、月次でのレビュー会議を設けて継続的な改善を促す体制が長期的な品質維持につながります。
著者:テレリモ総研編集部 鈴木 亮佑
ご不明な点はお問い合わせフォームからもご連絡いただけます。
- *1 出典:アイティーエム株式会社「システム監視の目的に合わせた項目と種類に関して」(2024年)
- *2 出典:株式会社DTS「自社で24時間365日のシステム運用保守体制を組むコストを試算」(2019年2月)
- *3 出典:Kaopiz Japan「24/365とは?システム安定稼働に必要な運用体制・コストを解説」(2024年)
- *4 出典:アイティーエム株式会社「システム運用監視サービスメニュー/価格表」(2024年)
- *5 出典:株式会社みんなシステムズ「Webシステム保守の外注先選び|契約前に確認すべき5つのSLA」(2024年)