IndexShare

初现 · 出现于 2026-06-17 · 17 天前 · 最近核对 2026-06-18

IndexShare 是一种稀疏注意力 (sparse attention) 的省算力打法：把原本每层都要重新算一遍的 token 选择 indexer，改成几层共用一个，省掉的正是上下文拉到几十万 token 以后占大头的那部分冗余计算。

智谱 AI 旗下的 Z.ai 在 GLM-5.2 技术博客里公布了这个做法，发布时间是 2026 年 6 月 17 日，离这个 7530 亿参数模型上线只过了 4 天。做法是每 4 层稀疏注意力共用一个 indexer，1M token 上下文下单 token 的 FLOPs 直接砍掉 2.9 倍，同一套共享思路还把 MTP 投机解码的接受长度拉高了最多 20%。

💡

GLM-5.2 把每 4 层稀疏注意力分成一组，共用一个 indexer，不再每层都重新做一遍 top-k 选择。原本每层都要跑的点积 + top-k 计算，现在 4 层只用算一次。智谱 AI 说，正是这一步优化才让 1M token 推理的成本降到能直接把它设成默认上下文窗口。

像送外卖的骑手先把路线摸清楚一次，接下来的四单都照着这条路线走，不用每一单都重新翻地图。

中文视角 · 出海机会

智谱 AI 自己把这项优化写进了英文博客，随后 Raschka 那种硬核架构解读、VentureBeat 的跑分对比也都跟上了——但页面列出的信源里没有一篇中文，这块技术拆解目前中文那边基本是空的。搜索量目前很薄、竞争也低 (页面上是 Google Trends 的粗略估算，别当精确数)，现在写还来得及，只是这词技术门槛不低，写的人得真正搞懂稀疏注意力这套架构，写浅了留不住这批读者。

搜索热度

峰值 ~397/月

更新于 2026-07-03

~397/月 ~198/月 0

2026-06-04 2026-06-19 2026-07-03

词的生命周期

萌芽

0–7 天
初现 ← 当前

8–30 天
验证中

31–90 天
上升

91–180 天
成熟

180 天以上

为什么是现在火？

TL;DR

Z.ai 2026 年 6 月 13 日放出的开源权重 GLM-5.2，让 IndexShare 成了今年被讨论最多的注意力效率优化：4 层共用一个稀疏注意力 indexer，1M token 上下文下单 token FLOPs 砍掉 2.9 倍。GLM-5.2 号称编程跑分打平 Claude Opus 4.8、超过 GPT-5.5，API 价格却只是零头，靠的就是这项技术。

5 个因素在推动它走红，右滑 →

Z.ai

GLM-5.2：专为长程任务打造

每 4 层稀疏注意力共用一个 indexer，1M 上下文下单 token FLOPs 砍掉 2.9 倍。

Jun 17, 2026

Sebastian Raschka

GLM-5.2 的 IndexShare 架构解读

一篇独立的技术拆解，讲清楚为什么每 4 层共用一个 index 在长上下文场景下依然站得住。

Jun 18, 2026

VentureBeat

Z.ai 开源权重的 GLM-5.2，用六分之一的成本在多个长程编程跑分上打赢 GPT-5.5

SWE-bench Pro 拿下 62.1 分，GPT-5.5 只有 58.6 分，定价每百万 token 输入 1.40 美元、输出 4.40 美元。

Jun 16, 2026

Y Hacker News

《GLM 5.2 在我们的跑分里赢了 Claude》

Jun 28, 2026 1,107 points · 513 comments

zai-org/GLM-5 #94

提案：给 GLM-5.3 建一套自动化对抗测试流水线，涵盖失败模式分类、轨迹生成、外加 IndexShare 压力测试

点出共享 indexer 可能带来的『IndexShare 交叉污染』，认为这是 GLM-5.3 发布前值得压测的一个待解决失败模式。

Jun 27, 2026

前景

未来 6 个月的信号走势和商业化节奏。

信号中等

营收弱

智谱这套 indexer 共享打法，赶上了 DeepSeek Sparse Attention 被全行业采纳的这波节奏，两个季度内大概率会有别的实验室做出同类打法、另起一个名字。

风险 · 如果 DSA 这套路线最后输给别的稀疏注意力设计，IndexShare 就只是 GLM 自己的一个小注脚，成不了行业通用词汇。

类比 · MTP (multi-token prediction) · Grouped-Query Attention (GQA) · Mixture-of-Experts (MoE)

变现时间线

现在

科普内容的搜索结果页还很空

目前只有 ML 博客在写，还没有专门的对比文章或工具类内容。
3-6 个月

同行实验室开始跟进这套打法

DeepSeek、Kimi、MiniMax 大概率会在下一代模型里试这套 indexer 共享方案。
6-12 个月

成为架构标配词汇

如果被广泛采用，以后模型对比文章里会像提 MoE、GQA 一样顺手提到它。

“IndexShare” 的竞争与机会 Placeholder

Needs at least one tracked query to compute — run enrich-trends or enrich-autocomplete to populate.

Content Gap

SERP dominated by X vs underserved queries

Revenue Potential

CPC range, affiliate availability, paid-platform count

Build Difficulty

Time-to-MVP, required integrations, incumbent lock-in

“IndexShare” 能做的点子

把这个词做成文章、网站、产品、帖子、邮件、视频或课程，随便挑一张卡片就能开干。

文章

IndexShare 是什么：GLM-5.2 怎么把 1M 上下文的算力砍掉 2.9 倍

『IndexShare 是什么』这类大白话搜索词，目前排上去的都是 ML 博客的硬核文章，还没有面向普通读者的深度科普。这个词目前还圈在 Raschka 那种技术长文里，SEO 窗口还是空的。

文章

IndexShare vs MTP vs GQA：大模型省算力打法全指南

把 IndexShare 和 Multi-Token Prediction、Grouped-Query Attention 放在一起对比，正好接住工程师选推理框架时常搜的『X vs Y』这类词。

文章

本地跑 GLM-5.2：IndexShare 对显存预算意味着什么

自己搭环境的人在 mlx-lm 上经常撞见『缺少 per-layer indexer params』这个加载报错，得有一篇讲清楚 IndexShare 每层权重要求的实操指南，才能在消费级显卡上把 GLM-5.2 跑起来。

产品

一个能揪出 GLM-5.2 部署里缺 IndexShare 逐层 indexer 权重的配置检查工具

vLLM/SGLang/mlx-lm 用户经常因为缺 per-layer indexer params 而加载失败，还没有明确提示——给独立跑开源模型的基础设施工程师做一个部署前的检查工具，能补上这个坑。

帖子 HN / r/LocalLLaMA

开源模型实验室集体开始共享 indexer 的这一年

GLM-5.3 还没发布，已经有三家实验室在抄智谱这套 4 层共享 indexer 的打法。

帖子 Newsletter / ML Twitter

智谱悄悄解决了别家还在硬扛的稀疏注意力成本

别的头部实验室还在把『1M 上下文』当参数表上的数字卖，GLM-5.2 已经把真正让它跑得起来的那处架构改动做出来了。

帖子 YouTube / Tech media

我用 GLM-5.2 跑了一周，说说 IndexShare 那个 2.9 倍到底在哪些地方真的兑现了

我喂给它一个 80 万 token 的代码库，每次响应都拿 Claude Opus 4.8 对照计时，省下来的算力刚好出现在文档说的那些地方，别的地方没有。

大家在搜什么 Placeholder

Long-tail queries to rank for — SERP-verified volumes pending enrichment.

Keyword

Est. Volume

Competition

Content Type

indexshare alternatives

—

Very low

Comparison

how to use indexshare

—

Low

Tutorial

indexshare vs X

—

Medium

Comparison

indexshare pricing

—

Low

Explainer

Run make et-enrich-trends to populate real queries.

“IndexShare” 的搜索结果

现在搜索的人会看到的页面：自然结果在上，有人投广告就显示在那。广告多少是实时的商业化信号。

常见问题

什么是 IndexShare？

IndexShare 为什么现在火？

IndexShare 是什么时候出现的？

约于 2026-06-17 公开出现（截至 2026-07-04 约 17 天前）。EarlyTerms 最早于 2026-06-18 记录到信号。

来源

这份报告引用的一手链接，点开任意一条都能自己核对。