次回の更新記事:既存のベンチマークテストは信頼できるのか?LLM評価…(公開予定日:2025年02月11日)

DeepSeek-R1の性能を検証 4つの主要言語モデルと比較

DeepSeek(DeepSeek-R1...
Read More

継続利用・累計利用特典企画のお知らせ

AIDBプレミアム会員の継続利用6ヶ月(...
Read More

学習者の目標達成をサポートするLLMシステムの開発

本記事では、効率的なスキルアップを支援す...
Read More

OpenAIの思考プロセスを重視した言語モデルo3-mini その能力と安全性

本記事では、OpenAIがリリースした新...
Read More

OpenAI o3-miniの安全機能に関する大規模検証 1万件超のテスト結果 

本記事では、OpenAIの新しい言語モデ...
Read More

ハルシネーションが創薬研究を進展させる可能性 LLMの新たな活用法

本記事では、LLMにおける「ハルシネーシ...
Read More

LLMにおける「計画立案能力」を高めるプロンプト手法の新提案

本記事では、LLMの自律的な計画立案能力...
Read More

プロンプト

LLMの出力をJSON形式などに構造化すると「思考の柔軟性」や精度に影響することが示唆される
Sakana AIが科学研究自動化フレームワーク『The AI Scientist』開発
LLMを「人間の心のケア」を行うカウンセリングAIとして実行するためのプロンプト手法
LLMは人間のような「共感的な対話」ができるか?実行プロンプトと検証結果
LLMにハイレベルな問題の解決アプローチを自分で考えさせるエージェント化手法「SelfGoal」
タスクを一度視覚化して取り組ませることで、LLMの推論能力を大きく向上させるプロンプト手法『Whiteboard-of-Thought(ホワイトボード思考法)』
ロングコンテキストはRAGもText to SQLも解決するか Googleがケーススタディを実施
『プロンプトレポート』OpenAIなどが作成した調査報告書 〜その3 プロンプトエンジニアリングのケーススタディ〜
『プロンプトレポート』OpenAIなどが作成した調査報告書 〜その2 マルチモーダルとエージェント〜
『プロンプトレポート』OpenAIなどが作成した調査報告書 〜その1 重要な用語と各種プロンプト手法〜
PAGE TOP