> 关于决赛评测数据集答案的问题

(1)请问决赛评测数据集的答案是唯一的吗?因为有些错句可能会有多种改法,例如:“质量可达500多吨”,既可以修改为“质量为500多吨”又可以修改为“质量约为500吨”。 如果答案唯一的话,要基于怎样的原则来从多个答案中确定最终的答案呢? 我们观察了给出的有答案的数据集,并没有找到明显的规律。

(2)目前GitHub上给出的分数就是最终的结果么?提交的答案会进行人工评测么?因为给出的有答案的数据集中有一些明显的错误(之前也有人提到了)

谢谢!

Posted by: sukangshi @ Aug. 30, 2021, 9:26 a.m.

您好,
(1)决赛评测数据集的答案是唯一的。
(2)我们对决赛数据进行了多轮精标,未设置人工评测。

Posted by: CTC_2021 @ Aug. 31, 2021, 2:49 a.m.
Post in this thread