模板社区
DeepSeek的Embedding的实现架构图
立即使用
4
0
0
举报
发布时间:2025年10月24日
DeepSeek的Embedding的实现架构图
图解展示了DeepSeek模型在多GPU环境下进行Embedding层计算的分布式架构。输入tokens经分发后,各GPU(如GPU0、GPU1)并行生成局部embedding表。为处理全局索引,系统需“找出掩码索引”、“转局部索引”并“掩码”无效值,再从本地表中“索引取出”对应向量。关键挑战在于不同GPU因数据分布不均导致输出embedding数量稀疏且不一致,无法直接拼接或all_reduce。解决方案采用填充/占位符机制,强制“第0行一定会被取出”,以此作为默认填充项,确保后续操作维度对齐。
发布时间:2025年10月24日
发表评论
打开APP查看高清大图
DeepSeek的Embedding的实现架构图
下载eddx文件
下载客户端
立即使用
社区模板帮助中心,
avatar_url 知图坊
关注
他的近期作品
查看更多>>