•  
  •  
 

Abstract

当前关于用于自动文本评分(ATS)的生成语言模型(GLMs)的研究几乎完全集中在通过应用程序编程接口(APIs)查询专有模型的方法上。然而,这些做法引发了透明度和安全性的相关问题,并且这些方法在效率或可定制性方面几乎没有提供任何优势。随着最近小型、开源模型的大量涌现,我们现在有机会使用配备普通消费级硬件的计算机来探索 GLMs —即所谓的“GPU 匮乏者”。在本研究中,我们分析了开源小型 GLMs 在 ATS 中的性能和效率。结果表明,通过微调,GLMs 可以达到足够好的性能,即便不是最前沿的水平。除了 ATS 之外,我们还小步推进,通过提示 GLMs 解释其评分来分析模型生成反馈的能力。模型生成的反馈显示出潜力,但需要针对具体应用场景进行更严格的评估。

DOI

https://doi.org/10.59863/RPJK4742

Share

COinS