2026-04-07 Daily

🧠 今天记录

  • 补充开发 flagcx的注册可以拿到 Mr 的索引映射? ✅ 2026-04-08 在 NCCL/FlagCX 的 IB 层都不需要 comm 隔离注册 MR
  • PD是全局的,每个 IB 物理设备只分配一个 PD,所有 comm 的 QP 都在同一个 PD 上创建
  • MR 自动跨 comm 复用:IB adaptor 有全局 MR 缓存(flagcxIbDevs[].mrCache),同一物理地址的第二次注册会直接引用计数 +1、返回已有 MR,不会重复调用 ibv_reg_mr
  • MR 绑定到 PD 而非 QP,同一 PD 下的任何 QP 都能使用该 MR

🚀 今日TODO

  • 修复 flagcxOneSideRegister 的 bug,提 PR ✅ 2026-04-08

🧩 遇到的问题 / 卡点

  • [ ]

📌 明天该干啥

  • [ ]

💡 随手记录