Hardwired Intelligence：当模型被“烧”进硅片，AI 的终局是硬件化吗？

Prior

Feb 27, 2026

开篇：最疯狂的赌注

2026 年初，硅谷最“疯狂”的公司可能是 Taalas。

在所有人都还在跪求英伟达 H100/B200，或者惊叹于 Groq 和 Cerebras 用昂贵的 SRAM 堆出极速推理时，Taalas 走了一条几乎是“自绝后路”的赛道：

他们把 Llama 3.1 8B 这个模型，直接做成了一块芯片。

不是烧录，不是微调，而是把 Transformer 的每一层权重、每一个矩阵乘法，物理地“翻译”成了硅片上的晶体管和连线。他们称之为“Hardcore Models”。

最近关于 Taalas 的讨论很热，有人说这是“半导体的浪漫”，也有人由于其极高的能效比，开始幻想一种“硬件奇点”——即 AI 自己设计芯片，芯片跑得更快，从而设计出更强的芯片，实现智能爆炸。

作为一个 Technical Builder，我对这种“奇点论”持保留态度，但对 Taalas 代表的 “算力平权” 趋势感到极度兴奋。今天我们不聊虚的，从第一性原理拆解一下：为什么说 Taalas 是算力战争的“特种部队”，以及为什么它不会带来你想象中的那种“奇点”。

一、暴力美学：打破“内存墙”的终极手段

目前的 AI 算力架构，本质上是被“冯·诺依曼瓶颈”锁死的。

无论是英伟达的 GPU 还是各种 NPU，由于计算单元和存储单元是分离的，跑模型时，数据必须在 HBM（显存）和计算核心之间疯狂搬运。这就像一个米其林大厨（GPU），手艺再好，但每次炒菜都要去隔壁仓库（HBM）拿盐，效率极低且极其耗电。

Cerebras 和 Groq 的解法是：把仓库搬进厨房。 他们用极昂贵的 SRAM 替代 HBM，把数据直接塞在计算单元旁边。速度快了 10 倍，但成本也炸了。

Taalas 的解法则是：拆了厨房，建一条全自动流水线。

Taalas 的芯片（HC1）是存算一体（Direct Memory-Compute）的极致。他们移除了 GPU 中所有为了“通用性”而存在的调度逻辑、缓存层级和复杂接口。整个芯片就是 Llama 3.1 的物理化身。

结果就是：

速度： 17,000 tokens/s（比 H100 快 ~100 倍）。
功耗： 降低 10 倍。
成本： 制造单一芯片的 BOM 成本极低（不再需要昂贵的 HBM 和 CoWoS 封装）。

二、为什么“自我进化的奇点”是个伪命题？

社区里有一种声音认为：“如果把这种超快芯片用来设计下一代芯片，AI 的进化速度将呈指数级爆发。”

这个逻辑很性感，但在物理现实面前，它有一个巨大的硬伤：原子比比特重得多。

1. 物理世界的延迟 (The Manufacturing Lag) 软件是可以零成本复制和迭代的，但硬件不是。即便 Taalas 的芯片在 1 秒钟内生成了下一代芯片的完美 Verilog 代码，你依然面临着无法压缩的物理周期：

Tape-out（流片）： 把代码变成光罩。
Fabrication（制造）： 台积电的晶圆厂排期、生产、切割、封装。

这个周期最快也要 3-6 个月。在这个周期内，你的 AI 并没有“变强”，它只是在等待。硬件迭代的物理钟摆，锁死了软件指数爆炸的可能性。

2. 沉没成本的博弈 (The NRE Trap) ASIC 的全称是 Application-Specific Integrated Circuit（专用集成电路）。重点在“专用”。做这一块芯片的 NRE（一次性工程费用）高达数千万美元。这意味着，Taalas 的芯片是一把“定型的锤子”。它只能跑 Llama 3.1 8B。如果明天 Meta 发布了 Llama 4，或者架构从 Transformer 转向了 Mamba/RWKV，这批芯片瞬间就会变成一堆昂贵的沙子。

所以，ASIC 不适合做“训练”或“探索”，它只适合做“确定性”的事情。它不是为了让 AI 自我进化，而是为了让已经成熟的 AI “白菜价”。

三、 Builder 的视角：从“炼丹”到“发电”

作为 Builder，我看好 Taalas 并非期待它能造出 God-like AI，而是看重它对 Crypto 和去中心化网络 的潜在价值。

我们正在从“大模型军备竞赛”（Training Wars）进入“推理成本战争”（Inference Wars）。

目前的 Crypto x AI 项目，比如 DePIN 算力网络，最大的痛点是验证困难和算力成本高昂。如果通用的 GPU 算力依然昂贵，去中心化推理就很难普及。

但 Taalas 描绘了这样一个未来：当一个经过验证的、强大的开源模型（如 Llama 3.1）被固化成芯片，它的边际调用成本将趋近于零（仅剩电费）。

这意味着：

端侧智能的爆发： 你的硬件钱包、路由器、甚至 IoT 设备里，可以内嵌一个不联网、无延迟、极其聪明的“物理大脑”。
可信计算的基础： 硬件固化的模型是不可篡改的。在区块链世界，这意味着我们拥有了物理层面的“代码即法律”。
算力成为日用品： 就像电网里的电一样，智能将变得极其便宜且随处可见。

结语

Taalas 确实是 2026 年最疯狂的赌注。它赌的是 “模型架构的收敛” —— 赌 Transformer 还会统治很久，赌 Llama 3.1 会成为 AI 界的 x86 指令集。

它带来的不是科幻电影里的“奇点爆发”，而是工业革命式的“成本坍塌”。

对于我们这些 Builder 来说，这比奇点更重要。因为只有当智能像自来水一样便宜时，真正的 Web3 应用爆发才会到来。

Prior’s Newsletter

Discussion about this post

Ready for more?