現実世界の確率分布における言語モデルの推定能力と改善方法 Googleが検証

LLMが確率分布を理解し、確率推定を行う...
Read More

包括的なRAG評価ベンチマーク『CRAG』Metaなどが開発

Metaなどの研究者らは、RAGシステム...
Read More

人とLLMの実際のチャット履歴から抽出した1,024のリアルなタスクでClaude 3などを評価した結果

現実のユーザーからの難しいクエリを使用し...
Read More

LLMは与えられたペルソナ(役割)に応じてバイアスが変化することが明らかに

LLMは学習データに含まれる社会的な価値...
Read More

セキュリティ

Googleなど、API経由でブラックボックスLLMの隠れ次元数を特定できる脆弱性を示す ※OpenAI社はこれを受け対策済み
GPT-4などのLLMがセキュリティ脆弱性とソフトウェア機能性の評価能力で高い精度を示す
外部からの攻撃で一度でも欺瞞を学んだLLMは現在の技術では完全回復が難しい
大規模言語モデル vs 小規模人間モデル(つまり人間)で「フィッシング詐欺メールバトル」を行った結果
キーボード打鍵音から入力文字を特定するハッキング技術の精度が高いことが判明
瞳に映る景色を3Dで再現 その可能性
ダークウェブの深淵を照らす言語モデル「DarkBERT」登場
AIに含まれるバイアスを検出・軽減するためのオープンソースライブラリ「AIF360」登場

業界/カテゴリー

PAGE TOP