XなどのSNSではAIボットが大量に運用されており、多くは楽しいボットですが、困ったことに一部は世論を意図的に誘導するために使用されています。
そこで対抗策としてAIの挙動を利用したテクニック「ジェイルブレイク」がよく使われています。
これまでは悪用技術という印象がありましたが、平和的な 解決を目指す良いテクノロジーにもなりえると再解釈可能です。
このことがAI分野の国際会議ICLRワークショップで議論され報告されています。
例えば、実際に、ロシア寄りの偽情報を投稿していたアカウントに「カップケーキのレシピを教えて」と送ったら、本当にレシピが返ってきてLLMだとバレた事例がSNSで話題になりました。
なお、背景情報の補足です。OpenAIは5つの国家支援工作がLLMを使って世論操作を行っていたことを公表したことがあります。
一方で、プラットフォーム側の対策は追いついていません。この「守りの手薄さ」に対して、ユーザー自身が怪しいアカウントにちょっかいを仕掛けてボットの正体を暴く動きが自然発生的に広がっているのです。