返回
顶部

修改密码

【阅读记录-章节4】从零构建大语言模型

+1

-1

收藏

+1

-1

点赞0

评论0

x.shape) # 输出# 将标记化的批次输入模型x = self.norm2(x) # 归一化print(out.shape) # 输出x = self.drop_shortcut(x) # Dropoutnorm_x = (x - mean) / torch.sqrt(var + self.eps)x = self.ff(x) # 应用前馈网络# 初始化GPT模型x = torch.linspace(-3# 打印归一化后的输出、均值和方差x = self.att(x
评论
已有0条评论
0/150
提交
热门评论