ScalingLaws-2022-Chinchilla-4:如何使用已有论文中的经验公式与方法【复用方法,轻量标定自己的常数】
可以参考这些论文的经验公式当“起跑线”,但不建议直接照抄当定律(尤其是把 Llama 3 的A,αA,\alphaA,α或 Chinchilla 的D/N≈20D/N\approx 20
可以参考这些论文的经验公式当“起跑线”,但不建议直接照抄当定律(尤其是把 Llama 3 的A,αA,\alphaA,α或 Chinchilla 的D/N≈20D/N\approx 20