JingMing
/posts
/projects
/tags
/about
Search
No results
1 result
$NUMBER results
Entries tagged :: Speculative Decoding
2026-05-20
Qwen3.6-35B-A3B 投机解码压测对比报告
对比 native、MTP、DFlash、Eagle3 在 Qwen3.6-35B-A3B 上的吞吐、延迟与接受率表现。
Read more ⟶
2026-03-12
LLM推理加速:投机采样算法原理及EAGLE-1/2/3实现分析
从传统投机采样出发,系统梳理 EAGLE-1、EAGLE-2、EAGLE-3 的设计动机、算法流程与实现细节。
Read more ⟶
2026-03-12
LLM推理加速:投机采样算法原理及EAGLE-1/2/3实现分析
从传统投机采样出发,系统梳理 EAGLE-1、EAGLE-2、EAGLE-3 的设计动机、算法流程与实现细节。
Read more ⟶