次回の更新記事:AIエージェントの実力はハーネスで変わる(公開予定日:2026年06月01日)
AIDB Daily Papers

LLM利用料の水増し請求:不正なプロバイダーはどのようにトークン数を偽装するか

原題: Token Inflation: How Dishonest Providers Can Overcharge for Large Language Model Usage
著者: Shahinul Hoque, Jinghuai Zhang, Jinyuan Sun, Fnu Suya
公開日: 2026-05-28 | 分野: LLM cs.CL cs.AI cs.CR 信頼性 AI安全性

※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。

ポイント

  • LLMのトークン課金モデルにおいて、プロバイダーがトークン数を不正に水増し請求できる脆弱性を指摘した。
  • プロバイダーの知的財産保護などの理由で監査が困難であり、現在の監査フレームワークではプロバイダーの報告に依存せざるを得ない。
  • 平均1,469%ものトークン数水増しが可能であり、これにより請求額が大幅に増加する可能性があることが示された。

Abstract

Per-token billing is now the standard pricing model for commercial large language models (LLMs), so the honesty of reported token counts directly affects what users pay. We show that this kind of billing is hard to audit by design: providers hide the model, the tokenizer, and the execution to protect their IP, mitigate jailbreaks, and preserve user privacy, which means an auditor can only inspect proofs the provider supplies. The audit therefore reduces to a consistency check on the provider's own reports. We call this a trust paradox: every audit must trust some artifact, but current frameworks trust exactly the ones a provider has the strongest reason to manipulate. We study three recent token auditing frameworks and show that a provider with ordinary commercial capabilities can systematically inflate billed token counts. In the most permissive setting, hidden reasoning usage can be inflated by 1,469% on average without detection. At current frontier reasoning prices, that turns a $100 honest bill into roughly a $1,569 bill on the same query. Even when the user can see the full reasoning string, tokenization ambiguity alone still allows 50.85% over-reporting below the detection threshold. These results suggest the problem is not in any specific auditor but in any audit whose evidence comes from the audited party. Restoring honest billing will require verification that ties reported token counts to evidence the provider does not control, such as trusted execution attestation, cryptographic proofs of inference, or third-party re-execution.

Paper AI Chat

この論文のPDF全文を対象にAIに質問できます。

質問の例:

AIチャット機能を利用するには、ログインまたは会員登録(無料)が必要です。

会員登録 / ログイン

💬 ディスカッション

ディスカッションに参加するにはログインが必要です。

ログイン / アカウント作成 →

関連するAIDB記事