次回の更新記事:既存のベンチマークテストは信頼できるのか?LLM評価…(公開予定日:2025年02月11日)

DeepSeek-R1の性能を検証 4つの主要言語モデルと比較

DeepSeek(DeepSeek-R1...
Read More

継続利用・累計利用特典企画のお知らせ

AIDBプレミアム会員の継続利用6ヶ月(...
Read More

学習者の目標達成をサポートするLLMシステムの開発

本記事では、効率的なスキルアップを支援す...
Read More

OpenAIの思考プロセスを重視した言語モデルo3-mini その能力と安全性

本記事では、OpenAIがリリースした新...
Read More

OpenAI o3-miniの安全機能に関する大規模検証 1万件超のテスト結果 

本記事では、OpenAIの新しい言語モデ...
Read More

ハルシネーションが創薬研究を進展させる可能性 LLMの新たな活用法

本記事では、LLMにおける「ハルシネーシ...
Read More

LLMにおける「計画立案能力」を高めるプロンプト手法の新提案

本記事では、LLMの自律的な計画立案能力...
Read More

論文

ナレッジグラフ(知識グラフ)とLLMを掛け合わせる方法のロードマップ
RAGシステムに「無関係な」文書を混ぜたほうがLLMの出力精度が上がる可能性が示唆された
ユーザープロンプトをLLMが言い換えて、LLM自身が理解しやすくする手法『RaR』
AGI(汎用人工知能)の原則6箇条とレベル5段階
ChatGPTはチューリングテスト(人間模倣ゲーム)に一定の確率で成功する。ただし解釈には注意を
LLMなどの生成AIの背後にある思考プロセスは人間とは全く異なるかもしれないことを示す仮説『生成AIのパラドックス』
ChatGPTの効果的なプロンプト手法における「基本のキ」を理論とテンプレート両方で紹介
自分の話し声を別の誰かの声にリアルタイム変換するモデルが、一般消費者向けCPUで動かせる軽さで登場
「自分を信じて限界を超えてください」など感情を込めたプロンプト『EmotionPrompt』が添えられると、ChatGPTなどLLMのパフォーマンスは向上する
約1.7万件におよぶLLM論文を調査した結果からわかる現在のLLM研究トレンド arXiv運営のコーネル大より発表
PAGE TOP