|
比年来人工智能技能希望快速,可以讓電脑發生拟真的英文文章,而台师大學者應用AI,举行電脑主動天生中文经济消息实验,成果顯示,部門文章内容與语料库比對後,發明電脑偷梁换柱再加润色的能力,已可坑骗專業人士,此可谓全世界首篇有關中文主動化处置的論文,近期已登载于《Journal of Library & Information Studies》期刊。
為领會文字天生技能在中文方面的能力,感觉電脑天生的中文到何者水平,台师大圖书資讯學钻研所傳授曾元顯與學生林郁绮,操纵開源码GPT-2 Chinese软件,将30万篇共1.5亿字的经济日报消息拿来练習,然落後行主動泡泡面膜,天生消息的实验,练習電脑進修30万篇经济消息,统共耗费了75小時,瘦身飲食,练習完後均匀每分钟可發生4篇消息。
讓電脑發生4万笔消息後,参考经济日报網站之分類:金融、证券、期貨、商情、财產、理财、國际共8類,從随機抽样出90篇,再以人工逐笔检視、筛選、修剪出15篇,作為電脑天生之消息,一样按類随機抽样经济日报15篇出来,作為人類撰写之消息。将這30篇消息随機分列次序,扣問12位受试者對其举行1到5分可托度的评价。
而受试者是從社交平台上招募而来,分為:專家组(硕博士经济相瓜葛所结業)、中等组(大學经济相瓜葛所结業)和一般组(大學非经济相瓜葛所结業),每组别离招募4人,共12人。成果,8位经济相瓜葛所结業的受试者较具辨别能力,而4位非经济相干科系结業的受试者,辨别能力较差,有一名乃至對付電脑天生的消息與人類撰写的消息,其平都可信度评分都不异。
在15篇人類撰写的消息中,有1篇的可托度12人评估的均匀為2.92,不及3,原由于没有逻辑、主觀性强等。而在15篇電脑撰写的消息中,有2篇其可托度皆為3.33,大于3,原由于内容公道、细節合适逻辑,此2篇的部門内容與语料库比對後,發明電脑偷梁换柱再加润色的能力,已可坑骗專業人士。
其他被認為可疑的電脑天生消息,重要原由于内容究竟的廚具清潔,较着马脚、逻辑的貌同实异、和日期、股票代码等数字的误值。
台师大暗示,此文章為此议题在全世界的首篇钻研,但愿能唤起更多的探究,供给更多人领會人工智能在中文主動化处置的成长現状,并進而配合探讨其可能的影响與因應之道。在财產界,AI天生文章可以辅助人们提高写作的效力。在教诲界,為了练習學生的表達能力,不该该借助AI發生文章来因應這類练習,其误用或滥用可能造成做弊的举動。
這些教诲上的弊病,除如今已有論文剽窃比對體系外,将来可能也必要有主動侦测體系,来快速辅助判定進修進程、學位論文、规划书、法定文书等具高危害、高报答、高影响之文件,是不是由電脑代工發生。社會學者、法令專家可能得未雨缱绻後续產生的各類环境。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services. |
|