个人笔记

1. 背景与问题定义

在 DDSI/RTPS 协议架构中，参与者（Participant）及其端点（Writer/Reader）的发现过程是相互独立且异步进行的。该过程主要依赖以下两个协议：

SPDP (Simple Participant Discovery Protocol)：用于发现远程参与者。
SEDP (Simple Endpoint Discovery Protocol)：用于发现远程端点（写入者或读取者）。

由于网络环境的复杂性（如延迟、丢包、多播到达时序差异），通信双方极易进入**不对称发现（Asymmetric Discovery）**状态。即一方已完成对另一方的发现，而反向发现尚未完成。

这种状态若未加管控，将引发以下核心问题：

1.1 数据交付风险

在缺乏严格状态同步的实现中，若读取者（Reader）已发现写入者（Writer），可能会尝试接收数据。此时若写入者尚未感知到该读取者的存在，可能导致：

无效数据传输：写入者可能向未确认的端点发送数据，造成带宽浪费。
安全隐患：读取者可能接收来自未经过完整匹配验证（如 QoS 不匹配）的源的数据。

1.2 通信阻塞风险

当处于“半连接”状态时（Reader 认为 Writer 存在并等待数据，但 Writer 认为 Reader 不存在而不发送数据），应用层调用 read() 或 take() 接口时可能陷入无限期阻塞。这是因为接收端在等待一个发送端认为“不需要发送”的数据流。

2. 核心解决方案：代理模型（Proxy Model）

Cyclone DDS 通过引入**代理（Proxy）**机制来解决上述不对称性问题。其核心设计原则是：本地实体仅与已知的远程实体镜像（即代理）进行交互。

2.1 基本定义

对于每一个检测到的远程实体，本地节点会在内存中创建一个对应的代理对象。该代理作为远程实体的本地镜像，代表其参与所有的匹配计算、状态管理及数据传输控制。

Proxy Participant：对应远程节点的镜像。
Proxy Writer / Proxy Reader：对应远程端点的镜像。

2.2 通信约束

代理模型强制执行以下通信规则：

发送限制：本地写入者（Writer）仅向已建立 Proxy Reader 的远程端点发送数据。
接收限制：本地读取者（Reader）仅接收来自已建立 Proxy Writer 的远程端点的数据。

通过这一机制，只有当双向发现均完成（即双方都建立了对方实体的代理）后，实际的数据传输通道才会被激活。

3. 工作原理与流程

3.1 代理创建与匹配流程

代理的生命周期遵循严格的层级创建逻辑：

参与者发现：
- 节点收到远程节点的 SPDP 消息。
- 创建 Proxy Participant。
- 启动租约（Lease Duration）计时器。
端点发现：
- 节点收到远程端点的 SEDP 消息。
- 在对应的 Proxy Participant 下创建 Proxy Writer 或 Proxy Reader。
匹配检查：
- 系统检查本地端点与新创建的代理是否满足匹配条件（Topic 名称、数据类型、QoS 策略）。
- 仅当匹配成功且双向代理均存在时，才建立逻辑连接并允许数据流动。

3.2 解决不对称发现的机制

代理模型通过状态机消除了时间窗口带来的不确定性：

场景：节点 B 发现了节点 A 的 Writer，但节点 A 尚未发现节点 B 的 Reader。
状态：
- 节点 B 创建了 Proxy Writer(A)，但节点 A 内部尚无 Proxy Reader(B)。
- 节点 A 的 Writer 查询本地代理列表，发现无对应的 Proxy Reader(B)。
结果：节点 A 的 Writer 不发送任何数据。直到节点 A 收到节点 B 的 SEDP 消息并创建 Proxy Reader(B) 后，通信才会开始。

此机制确保了不会出现“一端等待而另一端沉默”的死锁情况，同时也防止了数据发送给未经验证的接收者。

3.3 多播模式的特殊处理

在单播模式下，代理模型执行严格的白名单机制。在多播模式下：

写入者可将数据发送至多播组。
未建立代理的读取者理论上可能接收到多播数据包。
处理策略：虽然物理上可能收到数据，但在逻辑层面上，由于缺乏对应的 Proxy Writer，这些数据通常会被上层中间件丢弃或不进行处理，且不享受可靠性保障（如重传机制）。多播在此被视为一种可选的降级或优化手段，不改变代理模型对连接状态管理的核心逻辑。

4. 生命周期管理与资源回收

代理模型采用层级化的资源管理机制，确保分布式系统中的资源能够及时释放，避免“僵尸”连接积累。

4.1 层级结构

text

Proxy Participant (根节点)
├── Proxy Writer 1
├── Proxy Writer 2
└── Proxy Reader 1

4.2 销毁触发条件

触发事件	操作行为	影响范围
SEDP Dispose/Unregister	删除特定的代理端点	仅删除对应的 Proxy Writer/Reader
Lease Duration 超时	判定远程参与者失联	级联删除：移除 Proxy Participant 及其下所有子端点代理
显式下线通知	接收特定控制消息	立即清理相关代理资源，无需等待超时

租约机制（Lease Mechanism）：
SPDP 消息中包含租约时长声明。远程参与者需周期性发送心跳（SPDP 消息）以续租。若本地节点在指定时间内未收到心跳，则判定远程节点失效，自动触发级联清理，防止资源泄漏。

5. 方案对比与总结

相较于无代理或弱状态管理的实现，Cyclone DDS 的代理模型在以下维度表现出显著优势：

维度	朴素实现/无状态模式	Cyclone DDS 代理模型
连接建立条件	单侧发现即可尝试通信	双侧代理建立后方可通信
数据安全性	存在接收未验证数据的风险	仅处理来自已知代理的数据
阻塞风险	半连接状态易导致无限等待	代理缺失时主动抑制发送/接收，避免死锁
资源管理	依赖全局超时，清理滞后	层级级联删除 + 租约机制，清理精确及时
匹配严谨性	可能存在误匹配	执行 Topic + Type + QoS 三重验证

结论

Cyclone DDS 的代理模型本质上是通过在本地构建远程实体的状态镜像，将分布式的异步发现过程转化为本地的确定性状态机管理。该方法严格界定了“可见性”与“可通信性”的边界，从根本上消除了因网络异步性导致的数据一致性问题、安全漏洞及资源泄漏风险。

Prometheus

TARS

TinySTL

TinyWebServer

eXtremeDB

boost

ROS2

cyclone-dds

iceoryx2

ZeroMQ

DDS

1. 背景与问题定义

1.1 数据交付风险

1.2 通信阻塞风险

2. 核心解决方案：代理模型（Proxy Model）

2.1 基本定义

2.2 通信约束

3. 工作原理与流程

3.1 代理创建与匹配流程

3.2 解决不对称发现的机制

3.3 多播模式的特殊处理

4. 生命周期管理与资源回收

4.1 层级结构

4.2 销毁触发条件

5. 方案对比与总结

结论

1. 背景与问题定义 ​

1.1 数据交付风险 ​

1.2 通信阻塞风险 ​

2. 核心解决方案：代理模型（Proxy Model） ​

2.1 基本定义 ​

2.2 通信约束 ​

3. 工作原理与流程 ​

3.1 代理创建与匹配流程 ​

3.2 解决不对称发现的机制 ​

3.3 多播模式的特殊处理 ​

4. 生命周期管理与资源回收 ​

4.1 层级结构 ​

4.2 销毁触发条件 ​

5. 方案对比与总结 ​

结论 ​

1. 背景与问题定义

1.1 数据交付风险

1.2 通信阻塞风险

2. 核心解决方案：代理模型（Proxy Model）

2.1 基本定义

2.2 通信约束

3. 工作原理与流程

3.1 代理创建与匹配流程

3.2 解决不对称发现的机制

3.3 多播模式的特殊处理

4. 生命周期管理与资源回收

4.1 层级结构

4.2 销毁触发条件

5. 方案对比与总结

结论