訪問数の算出
弊社サーバープランでは、サーバー上のお客様のサイトへの月間総アクセス数(訪問数)が独自の基準に基づき計算されています。ここで言う訪問数とは、Nginxのログに記録された24時間ごとの一意のIPアドレスの合計値です。
訪問数とは
弊社では、サーバーインフラで発生したWordPressサイトへの正確な訪問数が記録されます。既出のボットのユーザーエージェントからの訪問はほぼすべて除外し、分析データからフィルタリングするために最善を尽くしています。wp-login.phpに対してブルートフォース攻撃を仕掛けようとしているものを特定した場合は、インフラから遮断します。
MyKinstaの「分析」画面の「プランご利用状況」セクションでは、当月の本番環境への総訪問数が表示されます。
「訪問数」セクションには、ステージング環境を含め、サイトを訪問した一意のIPアドレス数が表示されます。ステージング環境への訪問は、プランの使用量にはカウントされません。チャートは動的に更新され、詳細な情報も確認可能です。例えば、グラフ上の特定の時点にカーソルを合わせると、前日との訪問数の比較などの情報が表示されます。
分析に関するログデータは、30日間保持されます。プランの訪問数上限の超過を懸念される場合は、弊社への移行後、MyKinstaの「分析」画面を定期的に確認することをお勧めします。
原因不明のトラフィックの急増や不一致が見られた際には、弊社カスタマーサポートまでご連絡ください。
訪問に該当するものとしないもの
具体的に何が訪問とみなされ、何が対象外となるのか、いくつかの例を示します。
- 誰かがサイトを閲覧すると「1回の訪問」とみなされます。
- 誰かがサイトを閲覧し、別のページに移動しても「1回の訪問」とみなされます。
- エッジキャッシュ、またはCDNキャッシュから提供された訪問も、訪問数にカウントされます。
- WordPressの分析画面では、すべての環境(本番、標準ステージング、プレミアムステージング)へのアクセスが「1回の訪問」とみなされます。ただし、「プランご利用状況」には、本番環境への訪問のみがカウントされます。
- 誰かが同じコンピュータ(またはネットワーク)で2つのブラウザからサイトを閲覧しても、IPアドレスは同じであることから、「1回の訪問」とみなされます。したがって、同じ場所から1日に何度訪問しても、使用されたデバイスの数に関係なく、同じ日に同じIPアドレスで同じインターネット接続が使用されている限りは「1回の訪問」となります。
- 誰かが自宅からアクセスし、その後職場など別の場所からアクセスした場合は、2つのIPアドレスを使用してサイトにアクセスしたことになるため、「2回の訪問」とみなされます。
- 主要なボットのユーザーエージェントからの訪問は、訪問数にカウントされません。
- 401、403、429、451、499、501エラーを返すリクエストは訪問数にカウントされません。
- wp-login.phpページへの訪問は、訪問数にカウントされません。
Kinstaの訪問数と主要アクセス解析ツールの比較
サードパーティのアクセス解析ツールは、弊社によって計算されたデータと異なることがあることにご注意ください。アクセス解析ツールには、それぞれに独自の算出基準が設けられています。例えば、ボットやクローラーをフィルタリングするロジックを実装しているかどうかなどの違いがあります。
利用するツールによって、収集したデータと独自のルール(何をボットトラフィックとみなすか、何を正当なトラフィックとみなすか)に基づき、異なる数値が表示されます。
Google アナリティクス
Google アナリティクスは、サイトにJavaScriptを追加し、サイト訪問者のブラウザで動作させてデータを収集する仕組みです。手動で設定を行うか、Google アナリティクスのWordPressプラグインをインストールすることで導入可能です。訪問者のブラウザから収集したデータを元に、ユーザー数とセッション数が計算されます。Google アナリティクスはボットを除外し、デバイスやネットワークの変更(訪問者のIPが変更された場合など)を通じて訪問者を追跡することにより、人間の訪問者のみを表示する設計になっています。
ほとんどの広告ブロッカーやトラッカーブロッカーは、「www.google-analytics.com」をブラックリストに登録し、Google アナリティクスのJavaScriptライブラリを読み込まず、Googleのサーバーにデータが送信されないようになっています。その結果、Google アナリティクスのレポートに不完全または不正確な訪問者データが表示される場合があります。デフォルトでGoogle アナリティクスをブラックリストに登録しないブロッカーの場合、通常は、ポップアップ形式でユーザーに同意の要求が表示されます。ユーザーが同意しない場合、トラッキングは無効になります。さらに、Braveやトラッキング保護を強化したFirefoxなど、プライバシーを重視するブラウザの中には、デフォルトでGoogle アナリティクスをブロックしているものもあります。uBlock Origin、Ghostery、Privacy Badgerのような拡張機能をインストールしているユーザーの場合は、さらにトラッキングが制限され、実際のトラフィックを測定するGoogle アナリティクスの有効性が低下します。
そのため、Google アナリティクスでは通常、広告ブロッカーやトラッカーブロッカーを使用している訪問者、Google アナリティクスのトラッキングに同意しない訪問者、プライバシー重視のブラウザを利用する訪問者、追跡を制限する拡張機能を使用しているユーザーを追跡することはできません。しかし弊社では、クライアント側のトラッキング制限に関係なく、サーバーへのすべてのリクエストを取得するため、これらの訪問もすべてカウントされます。
Google アナリティクスは、デフォルトでは静的アセット(画像、CSSファイル、JavaScriptファイル、その他のメディアファイルなど)への訪問は追跡せず、主にウェブページ内でのJavaScriptの実行に基づくページビューとイベントを追跡します。静的アセットはJavaScriptを実行しないため、トラッキングのトリガーとならず、訪問としてカウントされません。しかし弊社では、静的アセットへの訪問も訪問にカウントされます。
また、Google アナリティクスは、ユーザーの属性に基づいて個々のユーザーの身元や機密情報が明らかになる可能性がある場合、レポートに含まれる情報を制限するためにデータのしきい値を適用する場合があります。これにより、プライバシー規制への準拠が保証され、個人を特定できる情報の公開が防止されます。
Google アナリティクスは、弊社の訪問数カウントと直接比較できる値を生成しないため、Google アナリティクスのデータを月間訪問数の見積もりの根拠として使用することは推奨されません。
Cloudflare Analytics
Cloudflare Analyticsは、サイトを訪れた訪問者数を確認できるサービスです。Cloudflareダッシュボードにログインし、「Websites」>(サイト名)>「Analytics & Logs」>「Unique Visitors」に移動します。
Cloudflareは、選択した時間枠全体のユニーク訪問者数を示します。つまり、週単位の表示を選択した場合、毎日のユニーク訪問者数も表示されますが、グラフの上部にある週単位の訪問者数は、毎日何回サイトを訪問したかにかかわらず、1週間を通したユニーク訪問者数をカウントしたものになります。

Cloudflareの訪問数と弊社の訪問数を適切に比較するには、毎日の訪問数を個別に合計するか、1日を選んで平均とし、それを掛け合わせることができます。上のスクリーンショットを例に挙げてみます。1日の訪問数を合計すると(78 + 83 + 63 + 39 + 73 + 79 + 55)、実際には「470」になります。このように、弊社での表示に近い合計を得ることができます。弊社データの数値が高いわけではなく計算方法に違いがあります。
関連して、WordPressにCloudflareのAPOを設定する方法はこちらをご覧ください。
サーバー統計
サーバーのデータを確認できるパッケージは多くあり、お使いのサーバーにも同様の機能が組み込まれているかもしれません。該当する場合は通常、高い精度で訪問数の推定に有用な情報を確認することができます。
ここで重要になるのは、サーバーの統計データパッケージがどのように訪問数をカウントしているか、そしてそれが弊社の訪問数の算出方法とどれだけ類似しているか/異なるかを理解することです。
弊社の訪問数の算出方法は、上でご紹介したとおりです。お使いのアクセス解析ツールがどのように訪問数を算出しているかは、個別に確認する必要があります。両者の違いを把握することで、弊社プラットフォームでどの程度の訪問数になるかを推定できます。
AWStatsは、cPanelを採用する多くのサーバーサービスに搭載されているプログラムです。AWStats訪問数の算出方法は、弊社の算出方法と似ているため、サーバープランの選択時に有用な指標となる可能性が高いです。
AWStatsのデータを見るには、cPanelにログインし、「Metrics」セクションの「Awstats」をクリックして、「Number of visits」(訪問数)列の合計を確認します。
ボットと分析データの不一致
ボットによるサイトへのアクセスが訪問にカウントされる場合とされない場合があります。
弊社では、よく知られた「ボット」(ユーザーエージェント)によるアクセスをカウントせず、分析データからこれを除外するよう最善を尽くしています。これには、APIコール、検索エンジンのクローラー、アップタイムボットなども含まれます。また、「wp-login.php」にブルートフォース攻撃をしかけようとするものがあれば、弊社インフラがトラフィックをブロックします。
しかし、ボットがユーザーエージェントになりすますこともあり、その場合、弊社のアクセスログでは訪問として表示されても、Google アナリティクスや、訪問者のブラウザで実行されるJavaScriptに依存する他のツールでは表示されないことがあります。このような理由から、特にブラウザで実行されるJavaScriptに依存するツールでは、訪問数に相違が生じる可能性があります。
ボットトラフィックはサーバーリソース(RAM/CPU/帯域幅)を必要とし、サーバーがこれに対してもサービスを提供する必要があるため、一部のボットは総訪問数に含まれる場合があります。適切に識別されたボットトラフィックを除外していますが、最終的にボットトラフィックは、人間のトラフィックと同様にサーバーのリソースを消費することになります。
大きな矛盾や過剰なボットトラフィックにお悩みであれば、CloudflareやSucuriなどのウェブアプリケーションファイアウォール(WAF)の導入をお勧めします。「悪意のある」トラフィックを広く網羅したデータベースを誇り、それに該当するトラフィックを自動で除外する役割を果たします。このようなサービスを利用することで、Google アナリティクスやその他のツールと、弊社の分析結果との間に生じる不一致をある程度抑えることが可能です。これにより、サーバープランにおけるコスト削減も期待できます。
IPまたはユーザーエージェントをブロックするルールの追加をご希望であれば、カスタマーサポートにお問い合わせください。対象についての情報をお知らせください。弊社のインフラストラクチャの仕組み上、この設定はWordPressのプラグインではなく、サーバーレベルで行う必要があります。詳しくは、弊社カスタマーサポートまでお気軽にお問い合わせください。
訪問数の急増
サイトへの訪問者数の急増は正当なものである可能性がありますが、その原因をよりよく理解するため、以下を確認してみてください。
- 総訪問数:訪問数には、弊社で管理するすべてのサイトが含まれます。最近新規サイトを追加した場合は、これが訪問数急増の一因かもしれません。
- マーケティングや宣伝: 最近、トラフィックを誘導するようなキャンペーンやイベントなどの販売促進を行なった場合は、その効果が表れているのかもしれません。
- SNSでのメンション:バイラルコンテンツ、インフルエンサーによるメンション、X、Reddit、Facebookなどのプラットフォームで取り上げられると、サイトのアクセス数が急増することがあります。
- トラフィックの多いサイトからの被リンク:人気のあるウェブサイトやブログ、ニュースサイトが、最近サイトのコンテンツにリンクを張った場合、訪問数が大幅に増えることがあります。
- 不審な行動:MyKinstaの「リクエスト数上位のクライアントIP一覧」を確認し、不審な活動が見られたら、IP制限ツールで不審なIPをブロックすることができます。また、Cloudflareアカウントを作成し、Cloudflareのウェブアプリケーションファイアウォールを利用することで、より高度なフィルタリングを行うこともできます。
- 新たな統合:ニュースアプリケーション、API、スクレイパーなど、最近サイトからデータを引き出すツールやサービスを追加した場合は、トラフィック増加の一因になっているかもしれません。
- 直リンク:他のサイトがCDNで配信するファイルや画像に直リンクしている場合、訪問数が増加する可能性があります。トラフィックが直接サイトに来ていない場合でも、それらのファイルにアクセスする各リクエストが訪問としてカウントされるために発生します。Cloudflareアカウントをお持ちの場合は、Hotlink Protectionを利用して、画像が他のサイトで使用されるのを防ぐことができます。
- ボットトラフィック:ボットの活動が疑われる場合は、Cloudflareアカウントを作成して、Bot Fight Modeを有効にし、正当なユーザーとボットを区別することができます。この機能により、ほとんどの訪問が区別されますが、正当なボットやAPI統合がブロックされる可能性もあります。その影響を必ず確認の上、必要に応じて設定を調整してください。
以上のような要因を確認することで、トラフィックの急増が正当なものなのか、対策が必要なものなのかを判断することができます。以上を踏まえても原因がわからない場合は、カスタマーサポートまでお問い合わせください。
まとめ
分析プログラムやパッケージでは、それぞれ独自のデータや計算方法が採用されています。弊社では、訪問数のカウントは、お客様のサイトのアクセスログ(リソースを要求するIPアドレスを追跡するもの)に基づいており、既知のボットはここから除外されています。
各プログラムが独自のデータと手法を使用しているため、弊社の分析結果と他のプログラムが生成した分析結果の完全な一致を保証することはできません。しかし、サーバーアクセスログを使用して一意のユーザーIPアドレスをカウントする他の分析プログラム(CloudflareやAWStatsなど)は、推定の基準として有用なものだと考えられます。