EarlyTerms

IndexShare

初现 · 出现于 · 17 天前 · 最近核对

IndexShare 是一种稀疏注意力 (sparse attention) 的省算力打法:把原本每层都要重新算一遍的 token 选择 indexer,改成几层共用一个,省掉的正是上下文拉到几十万 token 以后占大头的那部分冗余计算。

智谱 AI 旗下的 Z.ai 在 GLM-5.2 技术博客 里公布了这个做法,发布时间是 2026 年 6 月 17 日,离这个 7530 亿参数模型上线只过了 4 天。做法是每 4 层稀疏注意力共用一个 indexer,1M token 上下文下单 token 的 FLOPs 直接砍掉 2.9 倍,同一套共享思路还把 MTP 投机解码的接受长度拉高了最多 20%。

💡

GLM-5.2 把每 4 层稀疏注意力分成一组,共用一个 indexer,不再每层都重新做一遍 top-k 选择。原本每层都要跑的点积 + top-k 计算,现在 4 层只用算一次。智谱 AI 说,正是这一步优化才让 1M token 推理的成本降到能直接把它设成默认上下文窗口。

像送外卖的骑手先把路线摸清楚一次,接下来的四单都照着这条路线走,不用每一单都重新翻地图。

中文视角 · 出海机会

智谱 AI 自己把这项优化写进了英文博客,随后 Raschka 那种硬核架构解读、VentureBeat 的跑分对比也都跟上了——但页面列出的信源里没有一篇中文,这块技术拆解目前中文那边基本是空的。搜索量目前很薄、竞争也低 (页面上是 Google Trends 的粗略估算,别当精确数),现在写还来得及,只是这词技术门槛不低,写的人得真正搞懂稀疏注意力这套架构,写浅了留不住这批读者。

搜索热度

峰值 ~397/月
更新于 2026-07-03
~397/月 ~198/月 0
2026-06-04 2026-06-19 2026-07-03
词的生命周期
  1. 萌芽
    0–7 天
  2. 初现 ← 当前
    8–30 天
  3. 验证中
    31–90 天
  4. 上升
    91–180 天
  5. 成熟
    180 天以上

为什么是现在火?

TL;DR

Z.ai 2026 年 6 月 13 日放出的开源权重 GLM-5.2,让 IndexShare 成了今年被讨论最多的注意力效率优化:4 层共用一个稀疏注意力 indexer,1M token 上下文下单 token FLOPs 砍掉 2.9 倍。GLM-5.2 号称编程跑分打平 Claude Opus 4.8、超过 GPT-5.5,API 价格却只是零头,靠的就是这项技术。

5 个因素在推动它走红,右滑 →

前景

未来 6 个月的信号走势和商业化节奏。

信号 中等
营收

智谱这套 indexer 共享打法,赶上了 DeepSeek Sparse Attention 被全行业采纳的这波节奏,两个季度内大概率会有别的实验室做出同类打法、另起一个名字。

风险 · 如果 DSA 这套路线最后输给别的稀疏注意力设计,IndexShare 就只是 GLM 自己的一个小注脚,成不了行业通用词汇。

类比 · MTP (multi-token prediction) · Grouped-Query Attention (GQA) · Mixture-of-Experts (MoE)

变现时间线
  1. 现在
    科普内容的搜索结果页还很空

    目前只有 ML 博客在写,还没有专门的对比文章或工具类内容。

  2. 3-6 个月
    同行实验室开始跟进这套打法

    DeepSeek、Kimi、MiniMax 大概率会在下一代模型里试这套 indexer 共享方案。

  3. 6-12 个月
    成为架构标配词汇

    如果被广泛采用,以后模型对比文章里会像提 MoE、GQA 一样顺手提到它。

“IndexShare” 的竞争与机会 Placeholder

Needs at least one tracked query to compute — run enrich-trends or enrich-autocomplete to populate.

Content Gap
SERP dominated by X vs underserved queries
Revenue Potential
CPC range, affiliate availability, paid-platform count
Build Difficulty
Time-to-MVP, required integrations, incumbent lock-in

“IndexShare” 能做的点子

把这个词做成文章、网站、产品、帖子、邮件、视频或课程,随便挑一张卡片就能开干。

文章
IndexShare 是什么:GLM-5.2 怎么把 1M 上下文的算力砍掉 2.9 倍

『IndexShare 是什么』这类大白话搜索词,目前排上去的都是 ML 博客的硬核文章,还没有面向普通读者的深度科普。这个词目前还圈在 Raschka 那种技术长文里,SEO 窗口还是空的。

文章
IndexShare vs MTP vs GQA:大模型省算力打法全指南

把 IndexShare 和 Multi-Token Prediction、Grouped-Query Attention 放在一起对比,正好接住工程师选推理框架时常搜的『X vs Y』这类词。

文章
本地跑 GLM-5.2:IndexShare 对显存预算意味着什么

自己搭环境的人在 mlx-lm 上经常撞见『缺少 per-layer indexer params』这个加载报错,得有一篇讲清楚 IndexShare 每层权重要求的实操指南,才能在消费级显卡上把 GLM-5.2 跑起来。

产品
一个能揪出 GLM-5.2 部署里缺 IndexShare 逐层 indexer 权重的配置检查工具

vLLM/SGLang/mlx-lm 用户经常因为缺 per-layer indexer params 而加载失败,还没有明确提示——给独立跑开源模型的基础设施工程师做一个部署前的检查工具,能补上这个坑。

帖子 HN / r/LocalLLaMA
开源模型实验室集体开始共享 indexer 的这一年

GLM-5.3 还没发布,已经有三家实验室在抄智谱这套 4 层共享 indexer 的打法。

帖子 Newsletter / ML Twitter
智谱悄悄解决了别家还在硬扛的稀疏注意力成本

别的头部实验室还在把『1M 上下文』当参数表上的数字卖,GLM-5.2 已经把真正让它跑得起来的那处架构改动做出来了。

帖子 YouTube / Tech media
我用 GLM-5.2 跑了一周,说说 IndexShare 那个 2.9 倍到底在哪些地方真的兑现了

我喂给它一个 80 万 token 的代码库,每次响应都拿 Claude Opus 4.8 对照计时,省下来的算力刚好出现在文档说的那些地方,别的地方没有。

大家在搜什么 Placeholder

Long-tail queries to rank for — SERP-verified volumes pending enrichment.

Keyword
Est. Volume
Competition
Content Type
indexshare alternatives
Very low
Comparison
how to use indexshare
Low
Tutorial
indexshare vs X
Medium
Comparison
indexshare pricing
Low
Explainer
Run make et-enrich-trends to populate real queries.

“IndexShare” 的搜索结果

现在搜索的人会看到的页面:自然结果在上,有人投广告就显示在那。广告多少是实时的商业化信号。

常见问题

什么是 IndexShare?

IndexShare 是一种稀疏注意力 (sparse attention) 的省算力打法:把原本每层都要重新算一遍的 token 选择 indexer,改成几层共用一个,省掉的正是上下文拉到几十万 token 以后占大头的那部分冗余计算。

IndexShare 为什么现在火?

Z.ai 2026 年 6 月 13 日放出的开源权重 GLM-5.2,让 IndexShare 成了今年被讨论最多的注意力效率优化:4 层共用一个稀疏注意力 indexer,1M token 上下文下单 token FLOPs 砍掉 2.9 倍。GLM-5.2 号称编程跑分打平 Claude Opus 4.8、超过 GPT-5.5,API 价格却只是零头,靠的就是这项技术。

IndexShare 是什么时候出现的?

约于 2026-06-17 公开出现(截至 2026-07-04 约 17 天前)。EarlyTerms 最早于 2026-06-18 记录到信号。

相关词

同一领域里的其他词:别名、子类、竞品,以及值得接着看的邻近词。

继续探索

来源

这份报告引用的一手链接,点开任意一条都能自己核对。

  1. 01 Z.ai — GLM-5.2: Built for Long-Horizon Tasks (官方博客) z.ai
  2. 02 Sebastian Raschka — GLM-5.2 的 IndexShare 架构解读笔记 sebastianraschka.com
  3. 03 MindStudio — 《什么是 Index Share?》 mindstudio.ai
  4. 04 VentureBeat — Z.ai 开源权重的 GLM-5.2,用六分之一成本打赢 GPT-5.5 venturebeat.com
  5. 05 Hacker News — 《GLM 5.2 在我们的跑分里赢了 Claude》 news.ycombinator.com
  6. 06 GitHub zai-org/GLM-5 Issue #94 — IndexShare 压力测试提案 github.com
  7. 07 PhantomByte — 《1M 上下文的海市蜃楼:IndexShare 到底兑现了什么》 articles.phantom-byte.com