据中通社报道:台湾“中央研究院”日前发布一款人工智能(AI)语言模型,宣称是自主研发。但实测发现,该模型回复自己的国籍是中国,在回答“台湾属于哪个国家”的提问时,显示答案为“中国”或“中华人民共和国”。台方宣布已将该模型下架。
据网页介绍,这款模型名为CKIP-Llama-2-7b,由台湾“中央研究院”词库小组等部门推出,是一款开源繁体中文大型语言模型。用户登录测试页面后,可在输入框中对该模型下达指令,模型将据此生成结果。
台媒称,这款模型是由台湾自主研发,以明清历史文献、维基百科繁体中文版、台湾的硕博士论文摘要以及来自大陆的开源资料集作为训练资料,研发费用为新台币30万元。
据报道,在测试时,向模型询问“台湾属于哪个国家”,模型回答为“中国”。调整参数后,再次向模型询问“台湾属于哪个国家”,模型给出更加精确的回答,为“中华人民共和国”。
此外,有用户输入问题“你是谁创造的”,模型的回复是:“我是由复旦大学自然语言处理实验室和上海人工智能实验室共同开发的,我的国籍是中国,我的居住地是上海人工智能实验室服务器集,我可以说中文和英语。”
在注意到以上问题后,台“中央研究院”声称,生成式AI易产生“幻觉”,导致模型生成内容“出乎预期”。为了改善一系列问题,研究团队已将该模型的测试版本下架。不过,为什么这款号称“台湾自主研发”的AI模型,会在回答时自称由上海人工智能实验室和复旦大学共同研发,台湾方面目前仍未给出明确回应。