GEO 審計 / Curtis Fan / 2026-05-13
GEO 審計清單:用 Google AI 與 ChatGPT 測試品牌可見度
給香港 B2B 品牌的實用 GEO 審計方法:用 buyer prompt 測試 ChatGPT、Google AI、Perplexity 等平台,記錄品牌提及、引用來源、競爭對手和答案準確度,判斷下一輪應先修哪一頁。
先問一個商業問題,不是先問品牌名
只問 AI「Searchimp 是甚麼?」測到的,多數只是模型是否記得你的 brand entity。這當然有參考價值,但買家真正開始比較供應商時,不會這樣發問。更值得測的,是買家仍在摸索方案、比較風險、或整理 vendor shortlist 時,AI 會不會把你的品牌納入答案。
這件事牽涉的不只是一個新平台的追蹤。Search Engine Land 引用 Eight Oh Two 的 2026 survey,樣本是 500 名活躍 AI 用戶。該 report 指出,37% 會先以 AI 工具開始搜尋,85% 仍會到其他地方 double-check AI 答案。換句話說,AI 很可能負責第一輪理解,網站、Google、LinkedIn 和第三方內容則負責後續驗證。
因此,GEO 審計應該先定義 buyer situation。對香港 B2B 品牌來說,prompt 不能只寫「best software」或「GEO agency」。它應該加入地區、行業、採購角色、預算限制、合規顧慮,甚至買家最怕做錯的地方。這樣測出來的答案,才接近真實商業查詢。
把 buyer prompts 分成三類
第一類是問題診斷 prompt,例如「香港中小企點樣判斷網站是否已準備好被 AI 引用?」這類問題通常未到採購階段,但會影響 AI 如何理解你的專業範圍。第二類是供應商 shortlist prompt,例如「香港有哪些 GEO agency 適合 B2B 服務公司?」這類問題更直接關乎收入,因為 AI 已在幫買家篩選候選名單。
第三類是證據驗證 prompt。買家不一定直接接受 AI 的第一個答案,往往會追問「這間公司有沒有 case study?」、「是否懂香港市場?」或「同一般 SEO agency 有甚麼不同?」這些問題測的是品牌資料是否清晰可引用、是否有可信來源支持,以及是否能與競爭對手有效區分。
初期不用一次準備上百條。先以 10 至 15 條高意圖 prompt 跑一輪,已可見到幾個明顯缺口。到流程穩定後,再擴展至 30 條以上,分開測試 ChatGPT、Google AI、Perplexity、Gemini、Claude 或 Copilot。每條 prompt 都要獨立開新對話,以免前文脈絡影響後續答案。
把 AI 回答當成 evidence row
GEO 審計最容易失準的地方,是憑印象討論。有人覺得「好像有出現」,有人覺得「答案不太準」,最後難以判斷應該改哪一頁。比較實用的做法,是每條 prompt 留一行 evidence row。內容包括原句、平台、日期、品牌有沒有出現、描述是否準確、引用了哪個 URL、推薦了哪些競爭對手,以及是否值得截圖存底。
這種紀錄之所以重要,在於 AI visibility 未必立即反映為網站流量。Search Engine Land 報道的 Conductor benchmark 指出,在其數據集中,AI referral traffic 只佔整體網站流量 1.08 per cent。ChatGPT 佔 AI referrals 的 87.4 per cent。如果只等 GA 或 Search Console 出現明顯變化,可能已錯過 AI 答案層的早期信號。
同一份 benchmark 亦分析了 1,700 萬個 AI answers 和 1 億個 citations,反映「答案裡出現甚麼來源」本身已值得量度。對品牌而言,click 只是其中一個結果。在買家點入網站之前,AI 如何描述你、引用哪些來源、又把誰放在你前面,已在影響第一印象。
缺席時,先修最接近收入的頁面
如果 AI 沒有提到你的品牌,問題往往不在模型本身,而在於網站沒有把品牌講得足夠可引用。服務頁只寫「一站式方案」,卻未說清楚服務對象。Case study 只描述做了甚麼,沒有交代結果。About page 有故事,卻欠缺 team background、服務範圍和市場定位的清晰表述。
應優先處理最接近收入的頁面:首頁、核心服務頁、比較頁、case study、收費或 package 頁、FAQ。每頁都應回答一個買家會問的具體問題,例如誰適合用這個服務、通常由哪一步開始、需要準備甚麼資料、成功怎樣量度,以及甚麼情況下其實不適合。
重點不在於把所有頁面寫長。Search Engine Journal 有一篇由 No Fluff 贊助的 AI visibility 實驗文。文章用 150 條 buyer-style prompts,追蹤新品牌在 ChatGPT、Google AI Overviews 和 Perplexity 的出現情況。那篇 sponsored case 寫到,首六星期的 relevant response inclusion 是 16.5 per cent。報告同時列出 39 條問題出現、74 次 mentions、42 次 cited mentions,以及 61.6 per cent citation accuracy。這些數字不應被當成保證,但它提醒我們:GEO 要看的不是內容量,而是 prompt、引用、準確度和可驗證訊號。
每月重測,看是否真的進入買家 shortlist
GEO 審計做一次只是一張 snapshot。AI 答案會因平台更新、新來源出現、競爭對手補充內容或網站改版而改變。更有效的做法,是每月用同一組 prompt 重測。重點觀察 mention rate、answer accuracy、citation quality、competitor inclusion,以及 AI 建議的下一步是否符合商業現實。
若某幾條 high-intent prompt 持續推薦競爭對手,值得深究的不是「為甚麼 AI 不推薦我」,而是:競爭對手在哪些來源被清楚描述?他有沒有第三方 mention、case proof、比較頁或可引用的 FAQ?你的頁面是否只說自己很好,卻沒有提供 AI 可以安全引用的答案?
Searchimp 做 GEO audit 的重點,就是先把這些 buyer prompts 和 evidence rows 建起來,再決定下一輪應該修首頁、服務頁、case study、schema,還是外部訊號。不需要每條問題都被列在第一位。重要的是在買家真正準備比較供應商時,被準確、可信地納入考慮。
FAQ
GEO 審計要測幾多條 prompt?
起步可先用 10 至 15 條 high-intent prompt,覆蓋問題診斷、供應商 shortlist 和證據驗證。流程穩定後再擴展至 30 條或以上,並固定每月用同一組 prompt 重測。
只測 ChatGPT 夠不夠?
ChatGPT 固然重要,但香港買家可能同時接觸 Google AI、Perplexity、Gemini、Claude、Copilot,甚至行業工具。平台選擇應該跟 buyer journey,而不是只跟工具熱度。
如果 AI 提到競爭對手但沒有提到我,先做甚麼?
先截圖記錄答案,再比較 AI 引用了哪些來源。通常下一步不是再寫一篇泛用 blog,而是修核心服務頁、case proof、FAQ、schema,或補充清晰的第三方 brand mention。
GEO 審計結果可以當排名報告嗎?
不應該這樣定義。GEO 審計是答案層面的 visibility evidence,而非傳統排名報告。它應該同 SEO、網站查詢、CRM enquiry 和 sales feedback 一齊讀,才知道哪些 prompt 真正有商業價值。