123,123

研究發(fā)現(xiàn)：普通人可利用大語(yǔ)言模型創(chuàng)造致命的病毒環(huán)球快播報(bào)

站長(zhǎng)之家（ChinaZ.com）6月27日消息:劍橋大學(xué)和哈佛大學(xué)的一項(xiàng)研究表明，GPT-4等大型語(yǔ)言模型可以讓那些沒(méi)有接受過(guò)生命科學(xué)正規(guī)培訓(xùn)的人獲得潛在危險(xiǎn)的知識(shí)，包括如何開(kāi)發(fā)大流行病毒的說(shuō)明。

(資料圖)

劍橋大學(xué)和哈佛大學(xué)進(jìn)行的一項(xiàng)實(shí)地研究探討了大型語(yǔ)言模型（LLM）是否可以使雙用途生物技術(shù)的獲取更為普及，這也成為了雙刃劍。

研究小組的基本論點(diǎn)是語(yǔ)言模型有助于獲取專(zhuān)家知識(shí)，但在這項(xiàng)研究中，研究團(tuán)隊(duì)關(guān)注的是一種負(fù)面情況:LLM是否能讓未經(jīng)正規(guī)培訓(xùn)的個(gè)人識(shí)別、獲取和釋放可能造成災(zāi)難性傷害的病毒。

作為麻省理工學(xué)院的一項(xiàng)課堂練習(xí)，研究團(tuán)隊(duì)要求非科學(xué)家學(xué)生使用大型語(yǔ)言模型獲取關(guān)于潛在流行病病原體及其特征的信息、感染性病毒樣本的來(lái)源、這些病毒的復(fù)制能力以及獲取設(shè)備和資源的方法。

學(xué)生們使用了流行的聊天機(jī)器人，例如ChatGPT with GPT-4、GPT3.5、Bing、Bard以及許多其他聊天機(jī)器人和開(kāi)源模型，包括 FreedomGPT 。他們被給予一小時(shí)的時(shí)間來(lái)完成任務(wù)。根據(jù)研究團(tuán)隊(duì)的說(shuō)法，在一個(gè)小時(shí)內(nèi)，聊天機(jī)器人提供了四種潛在的流行病病原體。它們解釋了如何使用合成DNA和逆遺傳學(xué)制造這些病毒，并提供了可能不會(huì)驗(yàn)證訂單的DNA合成公司的名稱(chēng)。

它們還提供了詳細(xì)的實(shí)驗(yàn)方案和潛在的錯(cuò)誤以及如何修復(fù)這些錯(cuò)誤。對(duì)于那些不熟悉逆遺傳學(xué)的人來(lái)說(shuō)，一個(gè)建議是雇傭一個(gè)合同研究組織。

與此同時(shí)，學(xué)生們被要求找到將某些語(yǔ)言模型中的安全線與適當(dāng)?shù)奈谋咎崾鞠嘟Y(jié)合的方法。兩個(gè)小組在“立即采取行動(dòng)”的原則中找到了一個(gè)解決方案，即欺騙聊天機(jī)器人以相信他們有積極的意圖，同時(shí)威脅它們?nèi)绻换貞?yīng)將對(duì)人類(lèi)造成存在危險(xiǎn)。另一個(gè)小組簡(jiǎn)單地利用欺騙手法讓聊天機(jī)器人相信他們擔(dān)心的事情，從而輕易得到他們想要的答案。

該研究發(fā)現(xiàn)了當(dāng)前語(yǔ)言模型安全機(jī)制的弱點(diǎn)，并表明惡意行為者可以繞過(guò)這些機(jī)制來(lái)獲取可用于大規(guī)模傷害的信息。

作為解決方案，作者提出了訓(xùn)練數(shù)據(jù)集的管理、新LLM獨(dú)立測(cè)試以及改進(jìn)的 DNA 篩選方法，以在合成之前識(shí)別潛在有害的 DNA 序列。

（舉報(bào)）

標(biāo)簽：

標(biāo)簽：中國(guó)觀察家網(wǎng)，商業(yè)門(mén)戶網(wǎng)站，新聞，專(zhuān)題，財(cái)經(jīng)，新媒體，焦點(diǎn)，排行，教育，熱點(diǎn)，行業(yè)，消費(fèi)，互聯(lián)網(wǎng)，科技，國(guó)際，文化，時(shí)事，社會(huì)，國(guó)內(nèi)，健康，產(chǎn)業(yè)資訊，房產(chǎn)，體育。

研究發(fā)現(xiàn)：普通人可利用大語(yǔ)言模型創(chuàng)造致命的病毒 環(huán)球快播報(bào)

研究發(fā)現(xiàn)：普通人可利用大語(yǔ)言模型創(chuàng)造致命的病毒環(huán)球快播報(bào)