您好,我有个问题想问您。关于Itertaion的次数,我看代码里默认设置为1000次,请问这是您实验设置的参数吗?请问DeepSeek-R1模型在MATH数据集上您跑了多少时间,用了几张卡呢?
您好,我有个问题想问您。关于Itertaion的次数,我看代码里默认设置为1000次,请问这是您实验设置的参数吗?请问DeepSeek-R1模型在MATH数据集上您跑了多少时间,用了几张卡呢?