我们将在一个具有不规则行和列数的矩阵上测试我们的内核。
这将验证我们的 Padding 机制是否起作用。
torch.manual_seed(0)
x = torch.randn(1823, 781, device='cuda')
y_triton = softmax(x)
y_torch = torch.softmax(x, axis=1)
assert torch.allclose(y_triton, y_torch), (y_triton, y_torch)
结果与预期相同。
2024-10-25 17:45:22
我们将在一个具有不规则行和列数的矩阵上测试我们的内核。
这将验证我们的 Padding 机制是否起作用。
torch.manual_seed(0)
x = torch.randn(1823, 781, device='cuda')
y_triton = softmax(x)
y_torch = torch.softmax(x, axis=1)
assert torch.allclose(y_triton, y_torch), (y_triton, y_torch)
结果与预期相同。