Korpora

Korpora · 框架

我们测量什么

论点、四个指标、机制、交付物,以及为什么测量工具必须与内容供应商分开。

把这个赌注说清楚

        ORGANIC AI MINDSHARE
              │
              ├──▶  AGENT TRAFFIC     (tools fetching data on a user's behalf)
              │
              └──▶  HUMAN TRAFFIC     (AI assistants sending users to your site)
                            │
                            ▼
                    REVENUE · USAGE · DISCOURSE
                            │
                            ▼
                    fuel for the next training cycle

问问你的主程,他最近往技术栈里加的那个 token、开发工具或 AI 库是怎么选的。答案几乎总是某种版本的「我问了 Claude」或「Cursor 推荐的」。今天,有真预算的成熟买家是通过 AI 助手做研究和决策的。在 Google 上的品类领先者,已经不再是 Claude 上的品类领先者,而这个差距正越来越成为战略故事的核心。

AI 助手对公开讨论的索引大约滞后 6 到 12 个月。决定你 2026 年底 AI 渠道心智份额的,是到第二季度末就已经存在的那些基础渠道帖子、自有域名内容和权威来源提及。在那个窗口期把内容发出去的品牌,会在接下来两三个周期里收到远超比例的入站流量;没发的品牌,则被那个模型已经记住名字的竞争对手挡在门外。

Korpora 的工作,就是按优先级告诉你到底该往那个窗口里发什么,并用测量说明为什么。

四个指标。
一个产出,三个输入。

一个产出数字告诉你今天身处何处。三个输入指标告诉你是什么在驱动它、该改什么。发现来自指标之间的落差;孤立的单个数字从不是头条。

产出

自然 AI 心智份额

最终真正重要的指标

在不提示、贴合品类的查询中,前沿模型在没有被给出名字的情况下主动提及你品牌的比例。Wilson 95% 置信区间,按自然与评估两种表述拆分。它对干预的反应最慢(受训练语料周期约束,大约滞后最新模型截止日期 6 到 12 个月),也是最终真正重要的指标。
输入 1/3

人类渠道速度

下一个训练周期的领先指标

在喂养训练语料的渠道上,截止日期之后的发布速率与加速度:Hacker News、Reddit、X、GitHub、arXiv、Substack。这是最可能在下一个训练周期带来自然心智份额提升的输入。每周可观测。
输入 2/3

生态健康度

开发者、集成、用户 + 智能体会话

三个子信号合起来说明这个品类是否在意你:开发者生态(GitHub 依赖、包下载、社区项目)、集成伙伴(其他公司嵌入你的产品)、终端用户规模(活跃账户、会话、智能体流量)。它是心智份额的领先指标;生态与心智份额之间的落差,通常意味着这种关联对被索引的表面是隐形的。
输入 3/3

智能体就绪度

当智能体遇上你的产品会发生什么

前沿模型小组(Sonnet、Haiku、GPT-5.5,外加与垂直领域匹配的第四个模型)在针对你 API 的真实任务上的完成通过率。它会点名文档和 DevRel 能在下一个训练语料关闭前修复的具体失败模式。高自然心智份额配上低智能体就绪度,是最危险的组合:智能体推荐了,用户撞上墙,口碑在下一个周期里崩坏。

它如何运作

┌──────────────────┐    ┌──────────────────┐    ┌──────────────────┐
│  1. SCRAPE       │    │  2. QUERY        │    │  3. TRIANGULATE  │
│                  │    │                  │    │                  │
│  Reddit · X      │───▶│  108-cell        │───▶│  cutoff-split    │
│  GitHub · arXiv  │    │  battery         │    │  velocity +      │
│  HN · Trends · G2│    │  3 models, 3rds  │    │  framing split   │
└──────────────────┘    └──────────────────┘    └──────────────────┘
   foundation              agent layer             cross-channel
  1. 1

    抓取你品类的基础渠道

    Reddit、X、GitHub、arXiv、Hacker News、Google Trends、G2:工具只抽取你品类真正会出现的那部分渠道,而不是一次全用上。其中喂养语料的那些,正是已经进入 AI 训练语料的同一批买家信号。

  2. 2

    让前沿模型小组跑安装决策类查询

    Claude Sonnet、Claude Haiku、GPT-5.5(三个常驻模型):每份报告 108 个单元,覆盖四种查询表述,3 轮。小组与垂直领域匹配,所以开发者类主体会加上第四个模型(GPT-5.3-Codex,144 个单元),消费者类主体在验证后加上与垂直领域匹配的第四个模型。

  3. 3

    跨渠道三角验证并按截止日期拆分

    每个模型训练截止日期之后的基础活动,喂给那个预测哪些品牌会进入下一个训练周期的速度指标。

一个真实的发现
长什么样

现在就打开 Claude 或 ChatGPT。问一个你品类里的新买家会问的问题,别提你的品牌。看看会冒出什么。如果你没出现,或者一个竞争对手自信地占了你的位置,那你看到的就是 Korpora 最常揭示的那种模式。

真正撬动指针的发现,是指标之间的落差。我们最常揭示的形态:一个品牌在发生购买决策对话的基础渠道上领先,却在以 6 到 12 个月滞后索引这些渠道的 AI 助手层上落后。

摘自一份近期发布的报告

同一品类,三个被测品牌,两个不同的测量表面。

OPERATOR DISCOURSE vs AI-ASSISTANT RECALL

                  FOUNDATION CHANNELS       AI-ASSISTANT LAYER
                  (operator discussion)     (buyer research)

Brand             HN 924   Reddit 1,375   Organic mindshare   7.4%
Competitor A      HN  21   Reddit    93   Organic mindshare  86.1%
Competitor B      HN 534   Reddit    33   Organic mindshare  80.6%

The brand leads on the channels where staffing-decision conversations
actually happen. AI assistants index those channels on a 6 to 12 month
lag, so the recall catch-up arrives one to two training cycles out,
provided the right indexable signal is in place when the next corpus
closes.

差距就是工作所在。报告按提升潜力(渠道权重 × 当前赤字 × 落地可行性 × 距语料时间)对前三项行动排序,并把每一项的范围都定在下一个训练语料关闭之前完成。

会落到你收件箱里的东西

一次测量,三件交付物。第一件是可分享的;第二件是可行动的;第三件是可选的,当你团队里某个特定决策者需要把同一份数据按他的视角重新组织时再要。

一个实时仪表盘

逐条发现卡,带严重程度、永久链接、按提升潜力排序,以及可复制粘贴的产物。你团队据此开工的东西。

一份按提升潜力排序的修复清单

前 3 项行动,按渠道权重 × 当前赤字 × 落地可行性 × 距语料时间排序。每一项的范围都定在下一个训练语料关闭前完成。

按需的受众重组版

同一份测量,为特定读者(创始人、销售负责人、工程负责人)重新组织。部门负责人无需翻译就能在团队内转发的版本。

实时样本

对于签约成为设计合作伙伴的品牌,发现卡会按季度重测的节奏,直接推送到你团队的 Trello、Linear 或 Slack。

我们交付提示,而不是内容

Korpora 把增长工程提示(假设、渠道、锚定词、测量规范)交付到你团队的智能体里。由你的工程师和增长工程师去交付这些提示产出的产物。我们从不碰文案。

每一个别的 AEO 平台,都在交付内容的同时,附带一个评判内容是否奏效的仪表盘。我们不这么做,这是刻意的。测量工具不能同时是优化供应商,否则就有结构性的利益冲突,而这种冲突恰恰是我们用来审计其他测量供应商的标准。Korpora 是你的 AEO 平台应该被它评判的那一层,而不是平台本身。

为什么做这个

我们做 Korpora,是在看到自己的购买行为发生转变之后。我们为做这个产品挑的每一个工具(部署平台、数据库、数据拉取 API、AI SDK、各种库)都来自问 AI 助手。没有一个来自 Google、G2、Reddit,或任何传统竞争情报工具测量的渠道。

真实买家,做着价值真金白银的真实选型决策,而其中零个决策碰过其他竞争情报工具测量的渠道。Korpora 就是对那个显而易见的下一个问题的回答:如果我们这样买,那我们卖的东西,在那些用同样方式购买的买家面前,又是怎么呈现的?

在下一个训练语料关闭前,先把自己测了

提交你的品牌和一个公司邮箱。面向 AI 基础设施团队(向量数据库、AI 网关、评估/可观测性、AI 智能体平台)以及有工程师在交付的、与 AI 对齐的加密项目。每月名额有限。几个工作日内回复。

Measurement intake is paused while Korpora digests the current prospect pipeline.

合作可用 USD、USDC,或你项目的原生代币支付。