多伦多新锐芯片公司Taalas：AI模型“刻”进芯片，速度狂飙十倍！

点击标题下「蓝色微信名」可快速关注

关

注

枫投Fengtou.ca

加拿大商业信息平台

搭建企业家桥梁

壮大在加华人产业

推动商业科技创新

摘要：这块芯片的设计理念更是颠覆了传统认知：它只能运行一个固定的模型，无法更换、修改或升级。你买回家后，它就只会做一件事——以光速运行Llama 3.1 8B。

昨天，一家成立不到三年的多伦多初创公司Taalas在科技圈投下了一枚重磅炸弹。他们没有追逐大模型热潮，也没有开发炫酷的应用，而是选择了一条看似复古却极具颠覆性的路径——将AI模型直接“刻”进芯片中。

这家公司推出的芯片名为HC1，其性能令人瞠目结舌。运行Meta的Llama 3.1 8B模型时，它的速度达到了惊人的17000 tokens/秒。相比之下，目前业界最快的GPU也只能达到2000 tokens/秒左右，差距接近十倍。

然而，这还不是最疯狂的部分。这块芯片的设计理念更是颠覆了传统认知：它只能运行一个固定的模型，无法更换、修改或升级。你买回家后，它就只会做一件事——以光速运行Llama 3.1 8B。

“不灵活”的极致效率

Taalas的核心赌注是：在这个追求灵活性的时代，他们选择了绝对的“不灵活”，以换取极致的效率。

要理解这一点的重要性，我们需要回顾过去几十年芯片发展的主线。从CPU到GPU，再到各种AI加速器，所有技术都在努力打造通用计算平台，然后通过软件适配不同的模型和任务。然而，这条路已经走到了瓶颈：模型越来越大，内存带宽成了限制性能的关键因素。每次将数百亿参数从显存搬运到计算单元，消耗的能量和时间甚至超过了计算本身。

Taalas的思路非常简单粗暴：既然你每次都用同样的模型进行计算，为什么还要反复搬运数据？为什么不直接把权重存储在晶体管里？

于是，他们真的这么做了。HC1芯片中没有显存、没有HBM（高带宽内存），也没有复杂的缓存层级。每个模型权重都对应芯片上的特定晶体管，矩阵乘法通过电路的物理连接直接完成。输入一个token，电流流过这些预先设计好的路径，输出就是下一个token的预测。

这种设计类似于录音带和现场演奏的区别。传统芯片每次都需要重新“演奏”，而Taalas则是将“演奏”录在磁带里，播放即可。

惊人的性能表现

这种设计带来了几个令人震撼的结果：

1. 极致速度

17000 tokens/秒意味着什么？几乎是“零延迟”。有测试者表示，按下回车键的瞬间，答案就已经完整出现在屏幕上，看起来像是提前准备好的。这种速度让用户几乎感受不到任何等待。

2. 超低功耗

传统GPU运行AI推理需要液冷支持，一个机柜动辄消耗几十千瓦电力。而Taalas的芯片只需空气冷却，十张卡加起来仅需2.5千瓦。他们声称能效是GPU的十倍。

3. 成本优势

制造这样的芯片成本仅为传统方案的十分之一到二十分之一，大幅降低了部署门槛。

笔者亲测了demo聊天机器人，基本上回复是秒回，大写的WO CAO！

代价与挑战

当然，这种设计也有明显的代价。HC1芯片一旦出厂，命运便已注定：它只能运行Llama 3.1 8B模型。如果明年Meta发布了Llama 4，这块芯片就会变成电子垃圾。如果你发现模型存在偏见或不适合你的应用场景，也无法微调或更换，只能再买一块新芯片。

Taalas的解决方案是：通过与台积电合作，将定制芯片的周期从一年压缩到两个月。他们只需改变两层金属掩膜，就能为不同模型生产新芯片。据称，训练一个模型可能需要花费十亿美元，而定制这样一块芯片的成本仅为一千万美元。

豪华团队背景

Taalas的创始团队堪称豪华。CEO Ljubisa Bajic曾是Tenstorrent的创始人，并在AMD和NVIDIA担任过架构师；COO Lejla Bajic是他的妻子，同样在AMD和Tenstorrent有着丰富的经验；CTO Drago Ignjatovic则是前AMD的ASIC设计总监。这三位大佬在过去十年中设计了许多你可能用过的关键芯片。

2022年，当Jim Keller加入Tenstorrent并接管公司后，Ljubisa选择离开，并在六个月后创立了Taalas。显然，他与Keller对AI芯片的未来有着截然不同的看法。Keller希望打造一个通用、可编程、软件友好的平台，而Ljubisa则走向了另一个极端——彻底专用化。

资本加持与市场前景

Taalas刚刚完成了1.69亿美元的融资，总融资额达2.19亿美元。投资方中有一个值得注意的名字：Pierre Lamond。这位半导体行业的元老曾是Fairchild Semiconductor的核心成员，也是红杉资本的前合伙人。他的背书表明，这项技术至少在逻辑上是可行的。

但问题来了：市场会买单吗？

Taalas需要找到那些愿意为了效率和成本牺牲灵活性的场景。例如：

语音助手：需要毫秒级响应，且模型通常固定不变。
数据标注：需要处理海量文本，使用固定模型。
垂直领域专用模型：训练完成后无需频繁更新。

然而，质疑声也不少。有人担心，芯片制造本身会产生污染，如果每两年就要换一批芯片，环保问题如何解决？还有人认为，AI模型迭代速度太快，两个月的流片时间仍然太长，等芯片造出来，模型可能已经过时。

更根本的问题是：当OpenAI、Google、Anthropic都在拼命证明新模型比旧模型更好时，谁会愿意把自己锁死在一个固定的模型上？

Taalas的回应是：模型迭代周期正在变长，人们开始对特定版本产生依赖。例如，当OpenAI试图将用户从GPT-4.5迁移到GPT-5时，许多人抱怨新版本过于“谄媚”。也许未来我们会像对待手机型号一样对待AI模型：即使iPhone 15发布，仍有人坚持使用iPhone 14，因为它们各有各的好。

未来展望

Taalas是否会成功？这或许是一家改变行业的公司，也可能只是技术史上一个有趣的注脚。无论如何，他们的尝试为我们提供了一个全新的视角：在追求灵活性的同时，是否也可以接受一定程度的“固化”来换取更高的效率？

感兴趣的朋友可以去Taalas的demo站点体验一下什么是“光速级别”的推理性能！

详情：https://taalas.com/the-path-to-ubiquitous-ai/

演示聊天机器人： https://chatjimmy.ai

参考资料

Taalas官方发布信息
半导体行业分析报告
投资人背景资料

免责声明：枫投Fengtou.ca发布此内容中所含材料仅供参考，无意构成在任何司法辖区进行证券发行。此内容不应解读为买卖产品或证券的邀约、招揽或推荐。

注：由于微信公众号出现新的排序机制，您可能阅读不到我们的推送。如担心无法收到最新的加拿大枫投深度报道，可回到本号首页点击右上角，将公众号加星标，感谢诸位读者。

枫投加拿大

fengtouca

枫投—加拿大商业信息平台致力于利用互联网工具共建加拿大华人商业环境，在多元化的结构下，促进企业家交流沟通，分享经验和心得，并以此提高华人在加拿大的创业投资环境。

我们期待通过不断坚持的努力打造加拿大良好的创业土壤以及商业环境。

We look forward to building Canada’s entrepreneurial climate and business environment through our continued efforts.

PARD公司

PARD

加拿大PARD公司代运营枫投平台网站及自媒体账号，PARD公司是加拿大大温地区为数不多的互联网技术解决方案提供公司，公司成立8年，通过互联网前沿技术为各大企业提供从0到1的技术解决方案，包括不限于企业网站、APP应用、人工智能技术，区块链技术、智能硬件技术等。

如需合作请直接与公众号联系获得联系方式。公司网站：www.pardpro.ca

枫投理念

免费对接：免费对接，无论是创业还是投资，都是相互学习交流成长的过程。

企业家交流：汇聚加拿大扶持的基础产业以及高科技产业企业家社群，聚焦长期价值。

孵化帮助：全力以专业性辅导初创团队和项目，进行加速孵化以及商业化运作。

关注我们，一起寻求合作吧