线性回归
调优超参数
为了平衡模型的偏差与方差、训练速度与内存消耗等因素,GDS 提供了多个可供调优的超参数。每个参数的说明如下。
在基于梯度下降的训练中,我们试图为模型找到最佳权重。在每个周期中,我们处理所有训练样本以计算损失和权重的梯度。然后使用这些梯度来更新权重。对于更新,我们使用 Adam 优化器,如 https://arxiv.org/pdf/1412.6980.pdf 中所述。
训练统计信息在 Neo4j 调试日志中报告。
耐心值
此参数定义了连续无产出周期的最大数量。如果一个周期未能使训练损失至少改善当前损失的 tolerance
比例,则该周期是无产出的。
假设训练已运行了 minEpochs
,此参数定义了训练何时收敛。
设置此参数可以使训练更稳健,并避免像 minEpochs
那样提前终止。然而,过高的耐心值可能导致运行超出必要的周期数。
根据我们的经验,patience
的合理值在 1
到 3
之间。