RWKV-LM线性 Transformer 模型

0获赞0粉丝0关注
RWKV 是结合了 RNN 和 Transformer 的语言模型,适合长文本,运行速度较快,拟合性能较好,占用显存较少,训练用时较少。RWKV 整体
加载更多