サイトマップとは?XMLサイトマップの作り方・送信方法・SEO効果
与謝秀作

SEO対策の基本施策として、多くの解説記事で必ず登場するのが「サイトマップ」です。Webサイトの構造を検索エンジンに正しく伝え、クロールとインデックスを効率化するための重要な仕組みですが、「XMLとHTMLのどちらを作ればよいのか」「作ってもSEOに効果があるのか」「送信したあと何を確認すべきか」といった疑問を持つ担当者も少なくありません。本記事では、サイトマップの基本から種類・SEO効果、XMLサイトマップの具体的な作り方、Google Search Consoleへの送信方法、運用時の注意点までを体系的に解説します。
サイトマップとは
サイトマップ(Sitemap)とは、Webサイト内にどのようなページが存在し、どのような構造で配置されているかを一覧化したファイル、またはページのことを指します。直訳すると「サイトの地図」であり、Webサイト全体の構造を俯瞰できるようにする役割を担います。
サイトマップには大きく分けて「検索エンジン向け」と「ユーザー向け」の2種類があり、目的と読み手が異なります。検索エンジン向けのサイトマップ(XMLサイトマップ)はGoogleやBingなどのクローラーに対してサイト構造を伝えるためのもので、SEO対策の文脈で「サイトマップ」と言えば通常こちらを指します。一方、ユーザー向けのサイトマップ(HTMLサイトマップ)は、サイトを訪れた訪問者が目的のページを探しやすくするためのナビゲーションページです。
特にページ数が多い大規模サイト、更新頻度が高いメディア、サイト構造が複雑なECサイトなどでは、サイトマップを適切に運用することでクローラビリティ(クロールされやすさ)が向上し、結果として検索流入の最大化につながります。
サイトマップの主な種類
サイトマップにはいくつかの形式があり、それぞれ用途が異なります。代表的な種類を整理しておきましょう。
XMLサイトマップ
XMLサイトマップは、検索エンジンのクローラーに対してサイト内のページ一覧と、それぞれの更新日時・更新頻度・重要度などを伝えるためのファイルです。ファイル名は「sitemap.xml」が一般的で、sitemaps.orgで定義された共通フォーマットに従って記述します。Google・Bing・Yandexなど主要な検索エンジンがこの仕様に対応しており、SEOの文脈で「サイトマップを作る」と言えば、ほとんどのケースでXMLサイトマップの作成を指します。
HTMLサイトマップ
HTMLサイトマップは、Webサイトを訪れたユーザー向けに主要ページへのリンクをまとめたページです。サイト内のカテゴリ構造や記事の一覧を整理して掲載することで、ユーザーが目的のページにたどり着きやすくなります。SEO効果は限定的ですが、ユーザビリティ向上や内部リンク構造の補強、クローラーが深い階層のページを発見しやすくするという副次的な効果があり、サイト規模が大きいほどメリットが大きくなります。
画像・動画・ニュースサイトマップ
XMLサイトマップには、画像・動画・ニュースといった特殊コンテンツ専用の拡張フォーマットも用意されています。画像サイトマップは画像検索、動画サイトマップは動画の内容(サムネイル・タイトル・再生時間など)の伝達、ニュースサイトマップはGoogleニュースへの掲載を目的として利用します。自社サイトが画像・動画・ニュースを中心としたコンテンツを多く持つ場合は、通常のXMLサイトマップに加えてこれらの専用サイトマップを整備することで、該当する検索領域からの流入機会を広げられます。
サイトマップがSEOに与える効果
サイトマップを設置するだけで検索順位が上がるわけではありませんが、SEOの土台となる「クロール」と「インデックス」の効率を大きく改善します。具体的な効果を整理しておきましょう。
クロールの効率化
検索エンジンはリンクをたどりながらWebサイトを巡回(クロール)しますが、内部リンクから到達しにくいページや、階層が深いページは発見されにくくなります。サイトマップはサイト全体のページ一覧を直接クローラーに提示するため、リンク構造だけでは見落とされがちなページも確実に認識されます。結果として、クロールバジェット(検索エンジンが1サイトに割り当てるクロール資源)が重要ページに効率よく使われるようになります。
インデックスの促進
検索結果に表示されるためには、ページがGoogleのインデックス(データベース)に登録される必要があります。サイトマップに記載しても必ずインデックスされるわけではありませんが、検索エンジンに存在を知らせる重要なシグナルとなります。特に新規作成したページや、既存リンクから到達しにくい記事については、サイトマップに含めることで発見・インデックス登録までの時間を短縮しやすくなります。
新規ページ・更新ページの早期発見
XMLサイトマップにはページごとの最終更新日時(lastmod)を記載できるため、クローラーは前回のクロール以降に更新されたページを特定しやすくなります。頻繁にコンテンツを更新するオウンドメディアやニュースサイトでは、更新情報が早く検索結果に反映されやすくなり、鮮度が求められるキーワードで有利に働きます。
大規模サイト・複雑な構造での効果が大きい
Googleは公式ドキュメントで、ページ数が多いサイト・アーカイブが深いサイト・外部リンクが少ない新しいサイト・動画や画像などのリッチコンテンツを多く持つサイトでは、サイトマップの効果が特に大きいと説明しています。逆に、ページ数が数十程度で内部リンク構造が整っている小規模サイトでは、サイトマップを置かなくてもクロールは成立します。ただし設置コストが低いため、規模を問わず用意しておくのが基本方針となります。
XMLサイトマップの作り方
ここからは、実務で最もよく使うXMLサイトマップの作成方法を具体的に解説します。まず「何を含めるか」を決め、次にフォーマットを理解し、最後に作成方法を選ぶ、という順番で進めます。
サイトマップに含めるべきページ・除外すべきページ
サイトマップに記載するのは、検索結果に表示させたい「正規URL(canonical URL)」のみに絞るのが原則です。具体的には、トップページ・サービスページ・記事ページ・カテゴリページなど、検索流入の受け皿となる公開ページを含めます。
一方、noindexタグを付けたページ・canonicalで別URLを指定しているページ・404ページ・リダイレクト中のページ・会員限定の非公開ページなどは含めるべきではありません。これらを誤って記載すると、「検出 - インデックス未登録」や「ページにリダイレクトがあります」などのエラーがSearch Consoleに表示され、サイト全体の評価にノイズが入ってしまいます。
XMLサイトマップの基本フォーマット
XMLサイトマップはsitemaps.orgの仕様に従って記述します。最小構成では、<urlset>タグの中に、各ページの情報を<url>タグで列挙するシンプルな構造です。1ファイルあたり最大50,000URLまたは50MB(未圧縮)という上限があり、これを超える場合はサイトマップを分割し、「サイトマップインデックス(複数サイトマップをまとめるファイル)」を別途用意します。URLは必ず絶対URLで記述し、UTF-8でエンコードするのがルールです。
主要な要素(loc・lastmod・changefreq・priority)
XMLサイトマップの各URLには以下の4つの要素を記述できます。locはページのURLで必須項目です。lastmodはページの最終更新日(W3C Datetime形式)、changefreqは更新頻度(always/hourly/daily/weekly/monthly/yearly/never)、priorityはサイト内での相対的な重要度(0.0〜1.0)を示します。
なお、Googleは現在changefreqとpriorityを事実上無視していることを公式に明言しており、lastmodについても正確でない場合は参考情報程度にしか扱わない方針を示しています。そのため、実務では「正確なlastmodを出力する」ことに注力し、changefreqとpriorityは記述しないか記述しても期待しすぎない、というスタンスが主流です。
サイトマップの作成方法(3つの選択肢)
XMLサイトマップを作成する方法は大きく3つあります。1つ目は、CMS(WordPressなど)の標準機能やプラグインを利用する方法です。WordPressでは5.5以降の標準機能や「XML Sitemaps」「Yoast SEO」「Rank Math」などのプラグインによって、記事を公開・更新するたびに自動でサイトマップが更新されます。運用コストが最も低く、多くのサイトにとって推奨される方法です。
2つ目は、サイトマップ自動生成ツール(XML-Sitemaps.comなどのWebサービス)を利用する方法です。URLを入力するだけでクロールしてサイトマップを生成してくれるため、静的HTMLで構築されたサイトや、CMSを使っていないサイトに向いています。ただし、ページ数が増えた際に手動で再生成する必要があるため、大規模サイトには不向きです。
3つ目は、自社のシステムに合わせてサイトマップを動的生成する方法です。独自開発のECサイトやヘッドレスCMS構成など、大規模かつ複雑なサイトではこの方法が最も柔軟性があります。データベースから公開ページを抽出し、lastmodを正確に埋め込んだうえで、5万URLごとに分割しサイトマップインデックスでまとめる、といった処理を自前で実装することになります。
Google Search Consoleへのサイトマップ送信方法
サイトマップを作成したら、Google Search Consoleから送信し、クローラーに存在を知らせるのが標準的な運用です。送信自体は数分で完了しますが、送信後の状態確認までをセットで行うのがポイントです。
事前準備
送信する前に、サイトマップファイルをサーバーにアップロードし、ブラウザから直接URL(例:https://example.com/sitemap.xml)にアクセスして正常に表示されることを確認します。また、送信対象のサイトがGoogle Search Consoleにプロパティとして登録され、所有権が確認済みであることも前提です。ドメインプロパティかURLプレフィックスプロパティのどちらを使っているかで対象URLの範囲が変わるため、自社の登録状況を把握しておきましょう。
送信手順
Search Consoleにログインし、左メニューの「インデックス作成 > サイトマップ」を開きます。上部の「新しいサイトマップの追加」欄に、サイトマップのURL(ドメイン以降のパス、例:sitemap.xml)を入力して「送信」ボタンをクリックするだけで完了します。送信後、「送信されたサイトマップ」の一覧に追加され、ステータスが「成功しました」と表示されていれば正常に受理されています。
送信後の確認ポイント
送信から数日〜数週間かけてクロールが進むため、定期的に「検出されたURLの数」とインデックスの状態を確認しましょう。Search Consoleの「ページ」レポートでは、サイトマップから検出されたURLのうち、実際にインデックスされたページとされなかったページ、その理由(noindex・重複・ソフト404など)を確認できます。サイトマップに掲載しているのにインデックスされないページが多い場合は、コンテンツ品質や重複の問題を疑うサインとなります。
robots.txtでのサイトマップ宣言
Search Consoleからの送信に加えて、サイトルートに設置するrobots.txtにサイトマップのURLを記載しておくことも推奨されます。robots.txt内に「Sitemap: https://example.com/sitemap.xml」と記述しておくと、Search Consoleに登録していないBingやYandexなどのクローラーにもサイトマップの所在を伝えられます。複数のサイトマップを運用している場合は、行を追加して複数記載することも可能です。
Search Consoleへの送信とrobots.txtへの記載は二者択一ではなく、両方を行うのが標準的なベストプラクティスです。
サイトマップ運用でよくある失敗と注意点
サイトマップは「作って終わり」ではなく、運用を続けるほど効果を発揮します。現場でよくある失敗パターンを押さえておきましょう。
1つ目は、noindexページや404ページがサイトマップに混入しているケースです。CMSやテンプレートの設定によっては、非公開ページや削除済みページが自動的にサイトマップに残ってしまうことがあります。Search Consoleに警告が出ていないか、定期的にチェックすることが重要です。
2つ目は、URL正規化の不一致です。canonicalタグでは「www.example.com」を指定しているのに、サイトマップには「example.com」を記載しているなど、表記がぶれているとクローラーが混乱し、インデックスに悪影響を与えます。HTTPS/HTTP、wwwあり/なし、末尾スラッシュの有無を統一することが大前提です。
3つ目は、サイトマップが更新されていないケースです。静的に出力しているサイトマップを放置していると、新規記事が反映されなかったり、削除ページが残り続けたりします。CMSのプラグインや自動生成の仕組みを使い、コンテンツ更新と連動してサイトマップが自動更新される体制を整えましょう。
4つ目は、ファイル上限を超えているケースです。1ファイル50,000URL・50MB(未圧縮)を超えるとサイトマップは処理されません。大規模サイトでは必ずサイトマップインデックスを用意し、カテゴリや記事タイプごとにサイトマップを分割して管理することが必要です。
5つ目は、「サイトマップを送信すればインデックスされる」と誤解しているケースです。サイトマップはあくまで検索エンジンにページの存在を伝える手段であり、インデックス登録や順位を保証するものではありません。根本的にはコンテンツの品質・E-E-A-T・内部リンク構造を整えることが前提であり、サイトマップはその土台のうえで効果を発揮する補助的な仕組みであると理解しておきましょう。
まとめ
サイトマップは、検索エンジンにサイト構造を正しく伝え、クロールとインデックスの効率を高めるSEOの基盤施策です。XMLサイトマップ(検索エンジン向け)とHTMLサイトマップ(ユーザー向け)の役割を理解したうえで、自社サイトの規模・構造に合わせた作成方法を選び、Google Search Consoleへの送信とrobots.txtへの記載をセットで運用することが基本となります。正規URLのみを掲載し、lastmodを正確に保ち、更新と連動して自動生成される仕組みを整えれば、サイトマップは新規ページや更新情報を素早く検索結果に反映させる強力な武器になります。まずは自社サイトのサイトマップの状態をSearch Consoleで確認し、エラーや警告がないか、必要なページが過不足なく含まれているかを点検することから始めましょう。