转自:https://blog.csdn.net/qq_34218078/article/details/109591000
1.先D后G
1.1 不detach,但需要retain_graph=True
1.2 detach
2.先G后D
有些奇怪的方法,但可用。 因为 generator 的更新需要 discriminator 提供准确的 loss 和 gradient,先更新G,那它的依据又是什么?
链接中讲的很清楚。
2023-12-22 16:49:57
转自:https://blog.csdn.net/qq_34218078/article/details/109591000
1.1 不detach,但需要retain_graph=True
1.2 detach
有些奇怪的方法,但可用。 因为 generator 的更新需要 discriminator 提供准确的 loss 和 gradient,先更新G,那它的依据又是什么?
链接中讲的很清楚。