2026-03-30 Daily

🧠 今天记录

🚀 今日TODO

  • 确定 mooncake 传 kv cache 的 put 操作从 python 接口 batch_transfer_sync_write 传到 c++ 接口 batchTransferSync。 ✅ 2026-04-03
  • 完成 mooncake/nixl/nccl 三类后端在推理场景下性能的分析,输出文档Vllm PD baseline-qwen3-30B ,并输入到智源整个 flagos 当前推理场景的开发方案,确定了后续 flagcx/vllm-plugin-fl 的开发方案 ✅ 2026-04-03

🧩 遇到的问题 / 卡点

  • [ ]

📌 明天该干啥

💡 随手记录