次回の更新記事:既存のベンチマークテストは信頼できるのか?LLM評価…(公開予定日:2025年02月17日)

「すべてのソフトウェアをエージェントとして使う」ビジョンと実践例

ソフトウェアを自然言語で操作する新しい手...
Read More

「職業別にみるLLM活用の現状と今後」Anthropicが大規模調査 

これまで広い視野での「LLMによる仕事の...
Read More

o3-miniクイズ

*前回はDeepSeekについてのクイズ...
Read More

DeepSeek‑R1クイズ

2025年1月20日に最新版「DeepS...
Read More

継続利用・累計利用特典企画のお知らせ

AIDBプレミアム会員の継続利用6ヶ月(...
Read More

論文

「ChatGPTの1周年を記念して」、オープンソースLLMがChatGPTにどこまで追いついているか体系的調査報告
マインクラフトを上手にプレイするAI『JARVIS-1』登場
プロンプトを調整しないLLMのプロンプトエンジニアリング新手法『ControlPE』
LLMは「色」の概念をどれほど理解しているか
日常能力を試すテスト『GAIA』正答率、人間92%に対してGPT-4は15% 一般的なニーズに応えるAI開発の指針に
Microsoftの研究者ら、比較的小さなサイズでもタスクによってはOpenAIのGPT-4を凌駕する言語モデル『Orca2』を開発
キャラを一貫して再現する画像生成メソッド『The Chosen One』
ChatGPTなどのLLMにユーザーの性格特性を分析させる手法『PsyCoT』と実行プロンプト
LLMベースの新しい言語『SUQL』が示唆する「非構造化データのクエリ」を処理するパラダイム
「入力プロンプト」を最新情報で自動アップデート&最適化する手法『FRESHPROMPT』がLLMの出力精度を飛躍的に上げる
PAGE TOP