-
谁来执行训练任务(算力分发与动态匹配)
-
如何验证执行结果(无需全重算,仅验证争议算子)
-
如何分配训练收益(Stake、Slashing 与多角色博弈机制)
二、技术架构总览

三、模块详解
RL Swarm:协同强化学习训练系统
Gensyn 首创的 RL Swarm 是一种面向后训练阶段的去中心化多模型协同优化系统,具备以下核心特性:
分布式推理与学习流程:
-
生成阶段(Answering):每个节点独立输出答案;
-
批评阶段(Critique):节点互相点评他人输出,选出最优答案与逻辑;
-
共识阶段(Resolving):预测大多数节点偏好并据此修改自身回答,实现局部权重更新。
Gensyn 所提出的 RL Swarm 是一个去中心化的多模型协同优化系统,每个节点运行独立模型并进行本地训练,无需梯度同步,天然适应异构算力与不稳定网络环境,同时支持节点弹性接入与退出。该机制借鉴 RLHF 与多智能体博弈的思路,但更贴近协同推理网络的动态演化逻辑,节点根据与群体共识结果的一致程度获得奖励,从而驱动推理能力的持续优化与趋同学习。RL Swarm 显著提升了模型在开放网络下的稳健性与泛化能力,已作为核心执行模块率先在 Gensyn 基于 Ethereum Rollup 的 Testnet Phase 0 中部署上线。
Verde + Proof-of-Learning:可信验证机制
Gensyn 的 Verde 模块结合了三种机制:
-
Proof-of-Learning:基于梯度轨迹与训练元数据判断训练是否真实发生;
-
Graph-Based Pinpoint:定位训练计算图中的分歧节点,仅需重算具体操作;
-
Refereed Delegation:采用仲裁式验证机制,由 verifier 与 challenger 提出争议并局部验证,极大降低验证成本。
相较于 ZKP 或全重算验证方案,Verde 方案在可验证性与效率之间取得更优平衡。
SkipPipe:通信容错优化机制
SkipPipe 是为了解决「低带宽 + 节点掉线」场景下的通信瓶颈问题,其核心能力包括:
-
跳层机制(Skip Ratio):跳过受限节点,避免训练阻塞;
-
动态调度算法:实时生成最优执行路径;
-
容错执行:即使 50% 节点失效,推理精度仅下降约 7%。
支持训练吞吐提升高达 55%,并实现「early-exit 推理」、「无缝重排」、「推理补全」等关键能力。
HDEE:跨领域异构专家集群
HDEE(Heterogeneous Domain-Expert Ensembles)模块致力于优化以下场景:
-
多领域、多模态、多任务训练;
