2026-06-29 Daily

🧠 今天记录

  • 现有 flagcx 代码在空闲 cpu case 下虽然ttft 文档,但是确实存在与 old flagcx 相同参数下 ttft 会大 300ms ✅ 2026-06-29 旧 /workspace/liuda/pd_disaggregation/mooncake_conn/vllm-plugin/test-1-old-flagcx.log 新 /workspace/liuda/pd_disaggregation/mooncake_conn/vllm-plugin/test-1-new-flagcx.log 回归了三个改动(待画图)后发现 tebench 里面指定 64k 切分也会降低 latency

改之前: image.png

最终tebench性能为: image.png

image.png

🚀 今日TODO

🧩 遇到的问题 / 卡点

  • [ ]

📌 明天该干啥

  • [ ]

💡 随手记录