2 月 22 日消息,在B站,有 UP 主分享了自己用 ChatGPT 耗時僅僅半個小時寫成的本科論文,,順利通過國內(nèi)某查重網(wǎng)站檢查,,查重率不到 9%,。但是也發(fā)現(xiàn),,ChatGPT 所寫論文中“言之鑿鑿”列舉出的參考文獻(xiàn)居然大多都是“編造”的、根本不存在的文獻(xiàn),。
根據(jù)國外 Study.com 網(wǎng)站在今年 1 月向 1000 名 18 歲以上學(xué)生發(fā)起的調(diào)查顯示,,48% 的學(xué)生用 ChatGPT 完成小測驗,53% 的學(xué)生用 ChatGPT 寫論文,。
ChatGPT 在撰寫格式論文,、通過專業(yè)考試等領(lǐng)域的驚艷表現(xiàn),讓學(xué)生們歡呼雀躍的同時,,也讓高校,、研究機(jī)構(gòu)等率先擔(dān)憂和警惕起來,“反 ChatGPT”在學(xué)術(shù)圈率先成為一股新趨勢,。
近日,,香港大學(xué)向師生發(fā)出內(nèi)部郵件,表明禁止在港大所有課堂,、作業(yè)和評估中使用 ChatGPT 或其他 AI 工具,。如教師懷疑學(xué)生使用 ChatGPT 或其他 AI 工具,可要求學(xué)生就其作業(yè)進(jìn)行討論,、進(jìn)行額外口試及考試等措施,。
上周,《暨南學(xué)報 (哲學(xué)社會科學(xué)版)》,、《天津師范大學(xué)學(xué)報 (基礎(chǔ)教育版)》發(fā)布聲明,,提出暫不接受任何大型語言模型工具 (例如:ChatGPT) 單獨或聯(lián)合署名的文章。
在美國和歐洲,,更多高校和學(xué)術(shù)期刊等對 ChatGPT 的封殺通知出得更早一些,。
但是,單純提出“封殺 ChatGPT”就能杜絕論文抄襲和剽竊了嗎,?
此前大熱的“AI 換臉”應(yīng)用曾催生出一批“反 AI 換臉”的鑒別工具?,F(xiàn)在,鑒別是否 ChatGPT 生成的論文,,是否有可行的方法呢,?
聚焦在針對合成音視頻的鑒別技術(shù)研發(fā)的瑞萊智慧(RealAI),,其副總裁唐家渝向 TechWeb 表示,目前鑒別 ChatGPT 生成物的難點在于,,機(jī)器與人類撰寫的文本差異性特征較少,機(jī)器合成文本的結(jié)果無論從結(jié)構(gòu)和語義角度都能較好地遵循人類書寫的規(guī)則,,同時一個真人說話的方式也可能是多變的,、結(jié)構(gòu)有誤的,因此很難單純從文本本身就鑒別出是否由 ChatGPT 生成,。目前,,RealAI 針對合成文本的鑒別能力已在建設(shè)中,近期會有 demo 推出,。
數(shù)字水印用來“反 ChatGPT”是一廂情愿
在“反 ChatGPT”的技術(shù)流中,,數(shù)字水印技術(shù)一度被熱炒。但是數(shù)字水印真能用來反 ChatGPT 嗎,?
數(shù)字水印是一種可以用于保護(hù)文本,、圖像、音頻和視頻等數(shù)字內(nèi)容不受未經(jīng)授權(quán)的復(fù)制和分發(fā)的技術(shù),。數(shù)字水印可以將一些隱蔽的標(biāo)識信息嵌入到數(shù)字內(nèi)容中,,這些標(biāo)識信息通常不會對數(shù)字內(nèi)容本身造成影響,但可以幫助鑒別數(shù)字內(nèi)容的真實來源和版權(quán)信息,。
人們對用數(shù)字水印反 ChatGPT 有兩種想象,。
一種是,對 ChatGPT 生成的內(nèi)容打上數(shù)字水印,,以標(biāo)明這些內(nèi)容是 ChatGPT 所寫,,實現(xiàn)反 ChatGPT。但這需要 ChatGPT 等 AI 內(nèi)容生成公司的配合,,也就是他們愿意這么做,。
ChatGPT 的開發(fā)商 Open AI 此前曾表示在考慮通過對 AI 系統(tǒng)生成的內(nèi)容加水印的方法來輔助辨別文本是否出自 AI。不過截止目前并沒有看到 Open AI 采取該項行動,。
就算 AI 內(nèi)容生成企業(yè)愿意在生成的內(nèi)容中加入數(shù)字水印,,但在相關(guān)行業(yè)專家看來,數(shù)字水印只是一個技術(shù)手段,,不能解決所有的抄襲問題,。有些人可能會使用各種方法來刪除數(shù)字水印,或者通過改變一些單詞或句子的順序來規(guī)避數(shù)字水印的檢測,。
AI 生成內(nèi)容通常是基于大量的訓(xùn)練數(shù)據(jù)和模型參數(shù)生成的,。用數(shù)字水印反 ChatGPT 的另一種想象是,把內(nèi)容打上數(shù)字水印標(biāo)明版權(quán)身份,,避免被 ChatGPT 等 AI 模型用于訓(xùn)練,,從而防止被模仿和抄襲,。
但是這種想法多少有點一廂情愿。數(shù)字水印并不能完全保證內(nèi)容不會被用于訓(xùn)練模型,。一些不法分子可能會使用各種技術(shù)手段來嘗試刪除數(shù)字水印,,或者通過對文章進(jìn)行修改來繞過數(shù)字水印的檢測。此外,,一些不道德的人也可能會無視數(shù)字水印,,盜用版權(quán)內(nèi)容作為訓(xùn)練數(shù)據(jù)。
“反 ChatGPT”這些工具或可一用
目前用于檢測文章是否由 AI 生成的工具全球有幾款,,包括:
OpenAI GPT-3 Playground:由 OpenAI 開發(fā)的一個在線應(yīng)用程序,,用于測試和探索人工智能語言模型 GPT-3 的功能。在這個應(yīng)用程序中,,可以輸入一些文本,,并由 GPT-3 模型自動生成下一句話或者完整的文章。這個應(yīng)用程序也可以用來測試一篇文章是否是由 GPT-3 等語言模型生成的,。
Grover:由 Allen Institute for Artificial Intelligence 開發(fā)的一個用于檢測虛假新聞和偽造的文章的工具,。Grover 可以分析一篇文章的語言風(fēng)格和結(jié)構(gòu),并嘗試區(qū)分由人類和人工智能生成的文章,。這個工具還可以識別一些常見的偽造手段和技巧,。
AI21 Writer’s Studio:AI21 Labs 開發(fā)的一個在線寫作工具,可以為用戶提供自動建議和編輯服務(wù),,幫助他們寫出更加流暢和準(zhǔn)確的文章,。這個工具也可以用于檢測一篇文章是否是由人工智能生成的。
Botometer:由 Indiana University 和 University of Southern California 聯(lián)合開發(fā)的一個 Twitter 機(jī)器人檢測工具,。Botometer 可以分析一個 Twitter 賬號的活動和行為,,判斷其是否是由一個真實的用戶或者一個自動化機(jī)器人管理的。
上述這些工具都可以用于檢測一篇文章或論文是否由人工智能生成的,,但是需要注意的是,,它們都不是百分之百準(zhǔn)確的。
因此,,在評估一篇文章或論文是否 AI 所寫時,,最好結(jié)合多種方法和技巧,進(jìn)行綜合分析和判斷,。
以 ChatGPT 為例,,唐家渝向 TechWeb 提到,“辯別‘ChatGPT 生成物’一是利用好查重機(jī)制和技術(shù),,防止 ChatGPT 通過改寫,、總結(jié)等方式生成學(xué)術(shù)文章;二是從內(nèi)容本身來說,,ChatGPT 目前還不能完全保證學(xué)術(shù)文章的邏輯嚴(yán)謹(jǐn),、主題一致,,可以從語義層面加以辨別?!?/p>
另外,,從B站 UP 主分享的 ChatGPT 寫出的本科論文的情況來看,檢查文章的來源和背景,,如果這篇論文來自一個未知或者不可信的來源,,就需要更加謹(jǐn)慎地對它進(jìn)行評估了。
關(guān)于 ChatGPT 可能引發(fā)的論文抄襲現(xiàn)象,,前新東方在線 COO 潘欣則認(rèn)為“這種擔(dān)憂基本不需要?!薄皼]有 ChatGPT 的時候就沒有抄論文,、抄作業(yè)的了嗎?可以信一點就行了,,能用技術(shù)導(dǎo)致出現(xiàn)的問題,,一定可以靠技術(shù) + 行政手段解決掉?!?/p>
在學(xué)生黨看來,,用 ChatGPT 寫論文,里面數(shù)據(jù),,論據(jù)甚至引用的文獻(xiàn)都是瞎編的,,建議讓 ChatGPT 做些輔助工作就好,比如給論文大綱或大致方向的建議等,。
也有學(xué)生認(rèn)為需要自律,,“反 ChatGPT 軟件陸續(xù)上線,算法只會越來越完善,,就算現(xiàn)在蒙混過關(guān),,但被查出來只是時間問題?!?/p>
更多信息可以來這里獲取==>>電子技術(shù)應(yīng)用-AET<<