• 邮件反馈
  • 支持 TK
  • 那年今日
  • 微博

    • 看看最新
    • 那年今日
    • 随便看看
    • 过去一年
  • 文章

    • 皮相专栏
    • 百度空间
    • 焦点博客
  • 探索

    • TK猴子

  • 支持
下个页面那年今日

点右侧微博标记去微博订阅真爱粉群👉

加入tk真爱粉群
tombkeeper
2026-04-20 18:42
Ollama 官号被逼的用中文写回复 [笑cry] ​​​

图片描述 by gemini-3-flash-preview

详情
tombkeeper
2026-04-20 13:49
目前的微博生态: ​​​

图片描述 by gemini-3-flash-preview

详情
tombkeeper
2026-04-20 11:35
当年去中途岛号航母,虽然不饿但想体验一下在航母甲板上吃饭,结果汉堡被海鸥抢走一大半。然后我发现剩下那一小半也不咋好吃,就也扔给海鸥了。//@灵感之源:我大悉尼[允悲]
变态学教授无铭
2026-04-20 10:03被tk转发1次
这位女生终于明白为什么人家给食物盖了个铁罩了[允悲] 变态学教授无铭的微博视频 ​​​
详情
tombkeeper
2026-04-20 10:25
回复@章方梁:vllm和sglang都已经有本地PD分离的实现,这个论文主要是跨数据中心的PD分离。//@章方梁:想起了之前的DeepSeek也有PD分离的相关技术论文,对比了发现方向还是有差异。 查看图片
tombkeeper
2026-04-19 14:43被tk转发1次
Kimi 和清华发表了一项研究,实现了 Prefill 和 Decode 解耦,而且不是简单的异构,而是可以把 Prefill 和 Decode 放在不同的机房(arxiv.org/html/2604.15039v1)。

什么是 Prefill 和 Decode 呢?

你的考试成绩下来了,你跟你妈说:“这次成绩如果从一个线性序列的两端同时观察,会比较容易产生理解偏差。假设全班人数是一个固定的有限集合,把所有人按成绩从高到低排列,我所在的位置如果用前面有多少人来描述,会显得数量比较充足,因为在我之前仍然存在一个明显大于个位数的群体。”于是你妈开始思考你说的到底是啥意思,这个过程就是 Prefill。

等 Prefill 完成,你妈就会开始想是自己一个人打你,还是等你爸回家后对你进行男女混合双打,是拿拖鞋抽,还是用棍子打。这个思考过程就是 Decode。

在上面这个例子里,你给你妈发了一段复杂冗长的提示词。你妈自己想可能得想半天。Kimi 这个新研究就是让你妈拿起手机,把你说的这段话发给你爸,让你爸来 Prefill。你爸远程 Prefill 后,你妈本地 Decode。

Prefill 和 Decode 对硬件的需求并不一样。用同一套硬件来做的话,如果满足了 Prefill 的需要,在 Decode 阶段硬件就得不到充分运用,造成浪费。如果能把 Prefill 和 Decode 解耦,用不同的硬件来做,比如用贵的 GPU 做 Prefill,便宜的 GPU 做 Decode,甚至一个数据中心专门 Prefill,一个数据中心专门 Decode,那就能大幅提高效率,降低成本。

图片描述 by gemini-3-flash-preview

详情
tombkeeper
2026-04-19 23:07
你们感受一下什么叫人在家中坐,拳从天上来……//@fromaia:所以说理中客、双标和诡辩的例子永远不嫌多么,你又提供了一个绝佳案例。至于你为什么不举用来攻讦你“对面阵营”的词汇(如“瑜伽裤”“姨味”)的例子,那只有你自己知道了//@tombkeeper:前几年流行的“爹味”,最近一年常见的“登味”,这些半文盲词汇所描述的现象背后的本质都是这个问题:
tombkeeper
2019-08-06 20:09被tk转发2次
人要培养点自己的才华,才会欣赏别人的才华,才不会见不得别人的才华。

否则甭管多富有、多风光,内心会在某时某刻忽然虚弱。于是由怯而生怨,由怨而生怒,由怒而生愚,然后有种种不智的行为。 ​​​
详情
1234567...6477