時(shí)間:2023-05-02|瀏覽:244
量子位 | 公眾號(hào) QbitAI
你說ChatGPT,它寫的東西逼真到傻傻分不清?
沒關(guān)系!
現(xiàn)在,它的“克星”來了——一位華人小哥專門搞了這么一個(gè)網(wǎng)站,專門鑒別文字到底是出自于AI還是人類。
你只需要把相應(yīng)的內(nèi)容粘進(jìn)去,幾秒內(nèi)就能分析出結(jié)果。
比如這段從新聞網(wǎng)站里摘出來的。
它:“妥妥的人類~” 至于這段從推特上摘下來的文段。
它:“就知道是AI?!?p>如此神器一出,可謂迅速俘獲大家的芳心。這不,直接把服務(wù)器都給擠崩嘍(好在還有個(gè)備用的)。
這下,那些用ChatGPT寫作業(yè)的“熊孩子”也要慘啦? 這個(gè)網(wǎng)站名叫GPTZero。它主要靠“perplexity”,即文本的“困惑度”這個(gè)指標(biāo)就是用來評(píng)價(jià)一個(gè)語(yǔ)言模型的好壞的。
在這里,每當(dāng)你喂給GPTZero一段測(cè)試內(nèi)容,它就會(huì)分別計(jì)算出: 1、文字總困惑度 這個(gè)值越高,就越可能出自人類之手。 2、所有句子的平均困惑度 句子越長(zhǎng),這個(gè)值通常就越低。 3、每個(gè)句子的困惑度 通過條形圖的方式呈現(xiàn),鼠標(biāo)懸浮到各個(gè)方塊就可以查看相應(yīng)的句子是什么(這里就兩塊,因?yàn)槲掖藭r(shí)輸入的測(cè)試內(nèi)容就倆句子)。
之所以要繪制這樣的條形圖,作者也作出了解釋:根據(jù)最新的一些研究:人類書寫的一些句子可能具有較低的困惑度(前面說過,人類的困惑度是比較高的),但隨著繼續(xù)寫,困惑度勢(shì)必會(huì)出現(xiàn)峰值。 相反,用機(jī)器生成的文本,其困惑度是均勻分布的,并且總是很低。 除此之外,GPTZero還會(huì)挑出困惑度最高的那個(gè)句子(也就是最像人寫的)。
規(guī)則就是這些,接下來實(shí)際測(cè)一測(cè)。
首先來一段最新的英文新聞(目前還不支持測(cè)中文)。將它粘貼進(jìn)測(cè)試框(需注意每句至少5個(gè)單詞,建議每段能有10個(gè)句子,結(jié)果會(huì)更準(zhǔn)一些)。
很快,GPTZero計(jì)算出這段文字的總文字困惑度為27,句子平均困惑度為171.2,每條句子的困惑度圖長(zhǎng)這樣:以及困惑度最高的句子的值為476。
看這個(gè)結(jié)果,估計(jì)你也猜出了GPTZero的答案:是人類寫的。答對(duì)了。
來一段ChatGPT的。將內(nèi)容粘貼進(jìn)測(cè)試框,得出這段文字的總文字困惑度為31,句子平均困惑度為76.67,每條句子的困惑度圖長(zhǎng)這樣:以及困惑度最高的句子的值為99。
看起來,每項(xiàng)困惑度值都和上面那段差距都挺大的,應(yīng)該能猜出來是
熱點(diǎn):比特幣來襲 服務(wù)器挖礦 BTG幣 誰會(huì)是幣圈 比特幣pt