#461 「9割のサイトがAIに捨てられる時代」 〜ある社長の「SEO終了」宣言と最新調査の衝撃〜
「9割のサイトがAIに捨てられる時代」
〜ある社長の「SEO終了」宣言と最新調査の衝撃〜
先日、古くからの友人で、とあるIT企業の社長と話していた時のことです。
彼の会社はこれまで、自社ブログやオウンドメディアを通じて真面目にコンテンツを作り、SEO(検索エンジン集客)にかなり力を入れて成果を出してきました。
しかし、最近どうも様子が違うようで、彼は苦笑いしながらこうボヤいたのです。
「最近、一生懸命記事を書いても全然反響がなくてさ。費用対効果も合わないし、もうウチ、SEOの施策は全部やめたんだよ」
彼のようにデジタルリテラシーが高く、長年Web集客の最前線で戦ってきた人間からの「SEOやめた宣言」。もちろん、生成AI(AI検索)の台頭によってユーザーが検索結果をクリックしなくなった「ゼロクリック検索」の影響は大きいでしょう。 しかし、それだけではない、もっと構造的な「何か」が起きているのではないか…。
その理由について考えを巡らせていた矢先、私の手元に、彼のボヤキの「答え合わせ」となるような、非常に衝撃的(かつ痛快)な調査レポートが舞い込んできました。 PRテック企業の株式会社トドオナダが発表した「国内主要3,200媒体の『LLM事前学習データ通過率』大規模調査」というレポートです(※注1)。
驚愕の事実:AIの学習データに通過するのは、わずか「10%」
このレポートは、日本国内の主要なWeb媒体(ニュースサイト、専門サイト、ポータルサイトなど約3,200件)が、ChatGPTなどの生成AI(LLM)の「事前学習のデータ」として、どれくらい無事に読み込まれているかを調査したものです。
その結論は、Web業界の常識を根底から覆すものでした。
なんと、LLMの学習データとして「通過見込み」と判定された媒体は、全体のわずか「10.0%」に過ぎなかったのです。「条件付き」を含めても約3割。つまり、残りの約7割近いWebサイトは、AIの学習素材から事実上「排除(即捨て)」されているというのです。
世間ではよく「新聞社やメディアが、AIに勝手に情報を学習されないようにブロック(robots.txtで拒否)しているからだ」と言われています。しかし、レポートによれば、そうした「意図的なブロック」で弾かれたのは全体のわずか6%程度。
では、なぜ大半のサイトがAIから弾かれているのか?
最大の原因(約64%)は、クレンジングと呼ばれるデータ抽出の段階で「品質基準を満たさず、ゴミとして捨てられている」ことでした。
つまり、AIが読み取れる「データの構造」になっていないため、ノイズとして処理されてしまっているのです。
「掲載=露出」という広報とSEOの幻想が崩壊した日
さらに衝撃的だったのは、広報担当者が長年頼りにしてきた「プレスリリース配信サービス」ですら、約3割がAIから「即捨て」と判定されているという事実です。
プレスリリース配信会社は、情報を拡散することが目的なので、当然AIの巡回を「全許可」しています。門戸をフルオープンにしているにもかかわらず、です。
「有名ポータルサイトや専門サイトに記事が掲載されました!」と、これまでの広報やマーケティング担当者は喜んでいたかもしれません。しかし、そのサイトの「構造」がAI向けになっていなければ、AIの脳内には全くと言っていいほど情報が届いていないのです。
これは、従来のSEOやPRにおける「掲載されれば、認知される(露出する)」という集客モデルが、AI時代には完全に機能しなくなっていることを意味します。 私の友人の社長が「SEOをやめた」と判断した肌感覚は、恐ろしいほど正確だったわけです。ああ、ビックリ!
なぜ「人間のための説明文(SEO記事)」はAIに捨てられるのか?
過去10年間、デジタルマーケティング業界は「検索エンジンに評価されるための、分かりやすい説明文(SEO記事)」を量産してきました。
「〇〇とは?」「〇〇の選び方7選」といった、関連キーワードを網羅し、結論を先に書くようなテンプレート化された記事(「”〜とは”コンテンツ」とか「まとめサイト」です)。現在でも「AI対策」と称して、こうした記事の量産を勧める業者はいっぱいいます。
しかし、AIが求めているのは「人間向けの読みやすい長文」ではありません。 AIが推論の土台とするために求めているのは、主語と述語が明確に定義された「機械が解釈できる構造化された真正な知識(Machine-readable canonical knowledge)」なのです。
表側にどれだけSEO目的の長文を並べても、裏側で「このデータは何を意味するのか」という論理構造が欠落していれば、AIはそれを「テンプレート由来のテキスト過多(=中身のないノイズ)」と判定し、容赦なくゴミ箱に放り込みます。
「デジタル登記(LLMO)」という唯一の生存戦略
このレポートが残酷なまでに証明しているのは、私たちがこれまで提唱してきた「人間には情緒を、AIには論理を」という『二重構造』の必然です。
企業がAI時代にやるべきことは、AIの機嫌を取るために表側の文章を不自然に書き換えたり、コタツ記事を量産したりすることではありません。そんなことをすれば、AIに「即捨て」されるだけでなく、生身の顧客からも「体温のない、つまらない会社」として見放されます。
私たちがやるべきことは、ただひとつ。 表側は人間の心を動かす「自由な表現(情緒)」を取り戻すこと。 そして、Webサイトの裏側に、自社の事実(Fact)と境界線(Not)を、AIの母語である「構造化データ(JSON-LD)」を用いて、冷徹に『デジタル登記』することです。
9割のWebサイトが、AIにとって「構造を持たない透明人間(あるいはノイズ)」として処理されている今。不毛なSEOゲームからいち早く降り、自社の正しい実存をシステムへ「登記」した企業だけが、AIの脳内で圧倒的な「指定席」を確保できるのです。
「SEO、もうやめたよ」 あの友人社長のボヤキは、決して敗北宣言などではありません。新しい時代の「情報ガバナンス」へと歩みを進めるための、極めて真っ当で知的な決断だったのです。
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
(注釈・参考資料) ※注1:株式会社トドオナダ
【調査リリース】国内主要3,200媒体の「LLM事前学習データ通過率」を初の大規模調査(PR TIMES) https://prtimes.jp/main/html/rd/p/000000242.000054369.html
