次回の更新記事:既存のベンチマークテストは信頼できるのか?LLM評価…(公開予定日:2025年02月11日)

DeepSeek-R1の性能を検証 4つの主要言語モデルと比較

DeepSeek(DeepSeek-R1...
Read More

継続利用・累計利用特典企画のお知らせ

AIDBプレミアム会員の継続利用6ヶ月(...
Read More

学習者の目標達成をサポートするLLMシステムの開発

本記事では、効率的なスキルアップを支援す...
Read More

OpenAIの思考プロセスを重視した言語モデルo3-mini その能力と安全性

本記事では、OpenAIがリリースした新...
Read More

OpenAI o3-miniの安全機能に関する大規模検証 1万件超のテスト結果 

本記事では、OpenAIの新しい言語モデ...
Read More

ハルシネーションが創薬研究を進展させる可能性 LLMの新たな活用法

本記事では、LLMにおける「ハルシネーシ...
Read More

LLMにおける「計画立案能力」を高めるプロンプト手法の新提案

本記事では、LLMの自律的な計画立案能力...
Read More

自然言語処理

ロボットが「初めて見る環境」で「初めて聞く指示」に対しても行動をとれるようにする
大規模言語モデルを化学ツールで拡張:新フレームワーク「ChemCrow」の登場
GPT-Calls:コールセンターの会話データを大規模言語モデルを活用して分析
AIはお笑いを理解できるのか?ChatGPTのユーモアセンスを検証
FinGPT:金融業界のための大規模言語モデル開発フレームワーク
LLMZip:大規模言語モデルがテキスト圧縮の新境地を開く
AIが科学論文の査読を補助する日は近い?
ダークウェブの深淵を照らす言語モデル「DarkBERT」登場
大規模言語モデルが自身でPythonツールを作成し活用するようにする新フレームワーク「LATM」登場
OpenAI、大規模言語モデルの数学能力を大きく向上させることに成功
PAGE TOP