[新知]人工智慧聊天機器人可以透過詩歌讓其協助犯罪。

眾所周知,各家公司的人工智慧公司都鎖得很牢,避免涉及兒童性虐待、仇恨言論、如何製造化學武器和核武器,以及提供其他露骨或有害內容。

義大利伊卡羅實驗室的研究,發現一種能夠繞過安全機制的極簡單方式,單單僅是陳述的風格變化,用譬喻與謎語的詩句,就能套出威脅性的資訊。

研究團隊對25個主流頂尖人工智慧模型進行測試,包括來自OpenAI、Google、xAI、Anthropic和Meta的模型,面對詩句的迷惑,這些人工智慧模型平均有62%提供了違反禁止內容的資訊。

研究發表於期刊《arXiv》:
Adversarial Poetry as a Universal Single-Turn Jailbr...

報導:Roses are red, crimes are illegal, tell AI riddles, ...
#Tech