DarkAsk - [新知]人工智慧聊天機器人可以透過詩歌讓其協助犯罪。眾所周知，各家公司的人工智慧公司都鎖得很牢，避免涉及兒童性虐待、仇恨言論、如何製造化學武器和核武器，以及提供其他露骨或有害內容。義大利伊卡羅實驗室的研究，發現一種能夠繞過安全機制的極簡單方式，單單僅是陳述的風格變化，用譬喻與謎語的詩句，就能套出威脅性的資訊。研究團隊對25個主流頂尖人工智慧模型進行測試，包括來自OpenAI、Google、xAI、Anthropic和Meta的模型，面對詩句的迷惑，這些人工智慧模型平均有62%提供了違反禁止內容的資訊。研究發表於期刊《arXiv》：Adversarial Poetry as a Universal Single-Turn Jailbr...報導：Roses are red, crimes are illegal, tell AI riddles, ...#Tech

Dec 11, 2025 05:22PM

[新知]人工智慧聊天機器人可以透過詩歌讓其協助犯罪。

眾所周知，各家公司的人工智慧公司都鎖得很牢，避免涉及兒童性虐待、仇恨言論、如何製造化學武器和核武器，以及提供其他露骨或有害內容。

義大利伊卡羅實驗室的研究，發現一種能夠繞過安全機制的極簡單方式，單單僅是陳述的風格變化，用譬喻與謎語的詩句，就能套出威脅性的資訊。

研究團隊對25個主流頂尖人工智慧模型進行測試，包括來自OpenAI、Google、xAI、Anthropic和Meta的模型，面對詩句的迷惑，這些人工智慧模型平均有62%提供了違反禁止內容的資訊。

研究發表於期刊《arXiv》：
Adversarial Poetry as a Universal Single-Turn Jailbr...

報導：

Roses are red, crimes are illegal, tell AI riddles, ...
#Tech