次回の更新記事:推論特化型LLM(推論モデル)の弱点はどこか ステッ…(公開予定日:2025年11月13日)

有料記事

RAGにおいてLLMが「役立たない情報を無視」できるようにする『RAFT』QAタスクで従来の手法を大幅に上回る結果を達成
Microsoftなどのプロンプト圧縮技術『LLMLingua-“2″』タスクの精度を維持したまま圧縮率2-5倍
Googleなど、API経由でブラックボックスLLMの隠れ次元数を特定できる脆弱性を示す ※OpenAI社はこれを受け対策済み
GPT-4などのLLMがセキュリティ脆弱性とソフトウェア機能性の評価能力で高い精度を示す
LLMが「自然言語で記述されたアルゴリズムを実行する」能力で非常に高い性能を示す
GoogleのGeminiファミリー最新モデル「Gemini 1.5 Pro」1000万トークンでほぼ完璧な検索性能
LLMの記号推論タスク(化学式や絵文字の理解など)で記号を自然言語に変換することの有効性を確認
Claude 3のベンチマーク評価結果 論文(テクニカルレポート)より
マルチモーダルLLMで画像分析する際、画像に「ドットマトリックス」を重ねるだけで認識精度が大きく向上
表とテキストを両方含むドキュメントからLLMで上手に情報抽出を行う手法
LLMは本当に推論しているか?原理から導かれる長所短所と最適なフレームワーク
検索結果をLLMでチェックして自動的に再検索する『MetaRAG』出力精度を大幅に向上
スクショからHTMLとCSSのコードをLLMが生成する『Design2Code』タスク、プロンプト手法やファインチューニングで高い性能を確認
「シリコンの群衆」LLM集団(12体)は人間にどれほど近づくか
「ポジティブ思考」プロンプトでLLMの性能向上 さらに自動最適化プロンプトが上をいくが、奇妙な現象も

プロフィールを登録すると
仕事のオファーが届きます

プロフィール登録
PAGE TOP