我正在建立分布式参数/服务器类型的体系结构,并希望通过Azure上的表解决方案交流模型更新。
我很难找到有关将PyTorch模型state_dict保存到Redis缓存中的任何有用信息。由于每个实体的大小限制(64kb),我已经放弃了Azure Cosmos表,而是转向redis,因为模型的state_dict参数/权重要大得多,即使对于小型模型也是如此。
有人对我有什么建议吗?或者,即使有可能?

最佳答案

我的解决方案(在上面的@GuyKorland评论之后)是RedisAI。
我为模型数据实现了键值机制,并在虚拟机之间进行了通信。

for name, param in model.named_parameters():
    redisai_client.tensorset(f'{name}',param.data.numpy().cpu().detach())

08-04 10:23