2026-03-30 Daily
🧠 今天记录
🚀 今日TODO
- 确定 mooncake 传 kv cache 的 put 操作从 python 接口
batch_transfer_sync_write传到 c++ 接口batchTransferSync。 ✅ 2026-04-03 - 完成 mooncake/nixl/nccl 三类后端在推理场景下性能的分析,输出文档Vllm PD baseline-qwen3-30B ,并输入到智源整个 flagos 当前推理场景的开发方案,确定了后续 flagcx/vllm-plugin-fl 的开发方案 ✅ 2026-04-03
🧩 遇到的问题 / 卡点
- [ ]