編故事神器的完整版代碼來(lái)了!但OpenAI不保證不被濫用
技術(shù)永遠是把雙刃劍。
時(shí)隔九月,OpenAI終于放出了旗下最強NLP模型 GPT-2模型的完整代碼,包含15億參數。
這套模型最初是被OpenAI的工程師用來(lái)根據文本中已知的單詞預測下一個(gè)單詞,后來(lái)經(jīng)過(guò)大量數據訓練后,成為了現在的AI文本生成系統。該模型不僅可以根據給定的文本流暢地續寫(xiě)句子,甚至可以形成成篇的文章,寫(xiě)作水平堪比人類(lèi),被外界成為新一代“編故事”神器。
另外,GPT-2模型還可以執行機器翻譯、問(wèn)答、閱讀理解和總結段落等任務(wù)。之前,OpenAI 已經(jīng)發(fā)布了不同參數大小的三種GPT-2模型,今年2月,他們原本要釋出完整的GPT-2模型,期望GPT-2能夠被用來(lái)開(kāi)發(fā)成寫(xiě)作AI助手或是語(yǔ)言理解系統等應用。
但是許多研究人員持反對意見(jiàn),認為該套模型會(huì )被用于制造假新聞,甚至被極端主義團體濫用進(jìn)行意識形態(tài)的干涉影響,技術(shù)引發(fā)的爭議讓OpenAI決定暫緩完整代碼的開(kāi)源,僅發(fā)布較小型的模型、范例和技術(shù)白皮書(shū),供外部研究人員使用。
經(jīng)過(guò)幾個(gè)月的調查,OpenAI表示還未發(fā)現改模型被濫用的證據,所以選擇釋出模型的完整代碼。同時(shí)他們也開(kāi)發(fā)了一種檢測模型,來(lái)防范模型產(chǎn)生的造假文件,面對由GPT-2 生成的文本,檢測模型能夠帶來(lái)95%的成功率。
但OpenAI的研究人員也表示,隨著(zhù)文字生成器的輸出質(zhì)量持續提升,被濫用的可能性就會(huì )提高,而檢測的挑戰性也更高。
所以,后續OpenAI會(huì )持續研究語(yǔ)言模型存在的偏差,并通過(guò)參與Partnership on AI的“Responsible Publication Norms for Machine Learning”項目,與其他AI研究人員共同探討此類(lèi)問(wèn)題。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
