GEO FAQ / Curtis Fan / 2026-06-03
GEO 真客戶迷思:10、20 定 30 個 prompts?KPI 點定?點解自己 search 未必見到結果
拆解香港團隊最常問的 GEO 問題:prompt 數量怎樣定、KPI 應看甚麼、為何自己隨手 search 未必見到變化,以及何時應修頁而不是再加文章。
10、20、30 條 prompt,差別不在套餐價,而在決策範圍
如果你只是想知道網站最接近收入的答案有冇大缺口,10 至 15 條高意圖 prompt 已經夠起步。
現有AI Search Optimization Hong Kong的 baseline,亦多數由呢個起點開始。
因為第一輪要先找出 service page、comparison page 同 FAQ 邊度最易走樣。
但如果你已經進入持續量度,就唔好再只靠 10 條。Searchimp 的 baseline 會用固定 30 條中文 prompts。它會分開做供應商發現、商業比較、proof、行業 use case 同平台比較。30 條的作用,不是令 report 看上去更大,而是讓 monthly retest 有足夠覆蓋。
最重要的是把固定 baseline 同臨時探索分開。新出現的 buyer question 可以另外記,但不要每月都換 prompt set,否則你只會得到很多新答案,得不到可比較趨勢。
| 用途 | 建議 prompt 數量 | 何時用 |
|---|
| 快速找大洞 | 10 至 15 | 第一次 audit、重大頁面上線前、想先看最接近收入的問題 |
| 擴闊比較面 | 20 左右 | 已知有幾個 prompt clusters 卡住,想分行業或平台再看 |
| 固定 monthly baseline | 30 | 要看趨勢、競爭對手、citation movement,同答得穩唔穩 |
KPI 唔係只看有冇被提及
很多團隊一講 KPI,就只問『有冇 mention 我哋』。但對商業決策來說,mention 只係其中一格。品牌可以被提及,但分類錯、引用錯頁,甚至被放在唔適合的 use case,咁樣未必幫到生意。
如果你唔知 KPI 應該先落喺頁面邊度,可先用AI Answer Readiness Score。
它會先拆 clarity、proof 同 next-step。之後再用AI Search Optimization Hong Kong睇完整修正範圍。
- `mention rate`:AI 有冇把你放入 relevant set;低分先查類別定義、service page 定位、entity consistency。
- `answer accuracy`:AI 形容你講得啱唔啱;低分先查核心 facts、FAQ、過時第三方描述。
- `citation quality`:AI 引到邊頁,嗰頁撐唔撐到個 claim;低分先查 answer-ready page、方法頁、proof surface。
- `shortlist / competitor inclusion`:你同邊啲對手同場;低分先查 comparison page、差異化說法、適用情境。
- `next-step fit`:AI 建議的下一步有冇商業意義;低分先查 CTA、service routing、頁面角色分工。
做完後自己 search 唔到,唔等於無結果
先講 platform。Google AI Overview、AI Mode、ChatGPT、Claude、Perplexity 的 source mix 往往不同。2026 年一份arXiv 比較 Google Search、Gemini 和 AI Overviews 的研究亦發現,在它測到的系統組合裡,不同系統取用的 sources 有明顯差異,average Jaccard similarity 低於 0.2。
再講波動。同一問題、不同時間、微小 wording 變化,都可能令結果不同。所以 casual search 最多只適合找靈感,不適合做 KPI。真正可比較的,是同一平台、同一組固定 prompts、同一記錄方法下的變化。
最後是 query 本身。你自己搜尋品牌名見到自己,未必代表比較型 prompt 也會提到你。真正有商業價值的結果,很多時出在「邊間適合我」「應該點比較」「有哪些風險」這類問題。
見到結果差,先判斷係修頁、補 proof,定擴大 prompt set
- 有 mention,但描述錯:多數不是 ranking 問題;先修 service page opening answer、適用對象、限制說明。
- 有 mention,冇 citation:多數不是只欠多幾條 backlink;先補方法頁、FAQ、proof page,讓 claim 有落點。
- 只在品牌名 query 出現:不算 overall success;要增加高意圖 comparison prompts,同步補 comparison page。
- 不同平台反應差異很大:通常不是某個 tool 突然壞咗;先分平台記錄,再查 source gap 同 message fit。
- 30 條 prompts 大部分都弱:不是應該即刻寫 30 篇 blog;先回 priority pages、proof chain 同 commercial CTA。
如果你見到弱位集中在比較與 proof,先看香港品牌做 GEO 應先修哪幾頁?;如果連 reporting 該怎樣看都未定,可以用比較 GEO 服務商前要看甚麼證據?對照 deliverables。
一個比較實際的 GEO 判讀節奏
第一個月用 10 至 15 條 prompt 找大洞,順手定 core KPI。第二個月把固定 set 擴到 20 或 30 條,開始 monthly retest。每輪只修最影響收入和差異化的 5 至 8 個 prompt clusters,不要每頁齊改。
如果兩輪之後 mention rate 升咗,但 answer accuracy 同 citation quality 無動,代表 AI 開始知道你,但仲未夠信心引用或採用你最想它用的頁面。這時通常不是再加 trend post,而是回去補 method page、FAQ、proof surface 或第三方支持。
如果你正準備比較服務商,這個節奏亦可以直接當作對方 reporting checklist。對方講不到 prompt set、修頁次序同 retest 方法,多數之後都好難交代 KPI。
FAQ
可以只測 ChatGPT 嗎?
不建議。ChatGPT 很重要,但香港買家也會用 Google AI、Gemini、Claude、Perplexity 甚至其他中文工具。只看一個平台,很容易把平台偏好誤當成整體結果。
品牌有被提及,但未被引用,算唔算改善?
算是一半改善。這通常代表 entity 或類別辨識有進步,但 answer-ready page 同 proof surface 仍未夠強,未足以支撐可驗證 claim。
幾時由 10 條加到 30 條?
當第一次 audit 已經找出主要缺口,而你想開始 monthly retest、看跨平台走勢、或想追競爭對手同場情況時,就應把固定 set 擴到 30 條。
延伸閱讀
如果你想由概念行前一步,先檢查重點頁面是否答得清楚;之後再決定要不要看服務介紹。