#PaperADay 6 局部特征交换在强化学习中的泛化 关于泛化的讨论很好,既有一般性的(哈哈),也有更具体的强化学习方面,但提出的想法非常简单,我打算试一试: CLOP:通道一致的局部置换 给定一个3D张量(带批次的4D),在每个位置以某种概率随机与邻居交换位置,作为一个单元交换所有通道。像dropout一样,这通过共同适应减少了过拟合,但它并没有将任何通道归零,只是移动它们。 我同意在潜在空间中进行数据增强比在输入空间中更有效地实现泛化的想法。他们建议尽可能在空间层次结构的低层进行,但在2x2层级上这样做可能不是一个好主意,因为只有四种可能的置换,而其中任何一种都会干扰一半的空间信息。 请注意,他们调整了每场游戏的交换概率,这在报告一系列游戏的结果时通常是不做的。 在纯监督学习任务上的结果并不显著,但在不同位置插入CLOP并使用不同的训练方案可能会更好。