2026-04-07 Daily
🧠 今天记录
- 补充开发 flagcx的注册可以拿到 Mr 的索引映射? ✅ 2026-04-08 在 NCCL/FlagCX 的 IB 层都不需要 comm 隔离注册 MR
- PD是全局的,每个 IB 物理设备只分配一个 PD,所有 comm 的 QP 都在同一个 PD 上创建
- MR 自动跨 comm 复用:IB adaptor 有全局 MR 缓存(
flagcxIbDevs[].mrCache),同一物理地址的第二次注册会直接引用计数 +1、返回已有 MR,不会重复调用ibv_reg_mr - MR 绑定到 PD 而非 QP,同一 PD 下的任何 QP 都能使用该 MR
🚀 今日TODO
- 修复 flagcxOneSideRegister 的 bug,提 PR ✅ 2026-04-08
🧩 遇到的问题 / 卡点
- [ ]
📌 明天该干啥
- [ ]