品玩6月28日讯,据arxiv 页面显示,科罗拉多大学博尔德分校近日联手来自纽约大学的学者推出中文语料库 CLiMP。
据论文显示, CLiMP可以用来研究中文语言学者学习了哪些知识。 CLiMP由1000个最小对组成,涵盖9种主要的普通话语言现象。目前研究团队已经通过 CLiMP评估了11款不同的大模型,包括n-gram、LSTM 和中文 BERT。
实验显示,中文 BERT的测试结果达到平均准确率。
分享快讯到朋友圈
领取专属 10元无门槛券
私享最新 技术干货