Loading [MathJax]/extensions/tex2jax.js
次回の更新記事:LLMが生成するWebアプリケーションコードのセキュリ…(公開予定日:2025年05月09日)

LLM

プロンプトの影響によるLLMの性能のばらつきを考慮した評価指標「Sharpeスコア」 NAIST研究者ら考案
モデルとデータの大規模化で変化するLLMのハルシネーション Google DeepMindの研究
LLMにおける現状のリスクと対策に関するまとめ
LLMのサイバーセキュリティタスク性能評価フレームワーク「Cybench」
民事裁判をLLMで模倣 シミュレートを経てLLMの法律能力が強化される
Google DeepMindがリリースした新世代の画像生成モデル「Imagen 3」テクニカルレポート
LLMの事前学習とファインチューニングの関係
LLMから「LLMエージェント」へ ソフトウェアエンジニアリングにおける今後の展開
LLMの出力をJSON形式などに構造化すると「思考の柔軟性」や精度に影響することが示唆される
Sakana AIが科学研究自動化フレームワーク『The AI Scientist』開発
LLMを「人間の心のケア」を行うカウンセリングAIとして実行するためのプロンプト手法
OpenAIがGPT-4oの評価を発表。音声性能が高く、それゆえのリスクも
「LLMはプロンプトから新しいタスクを学べるのか?」 という根本的な問いに対する3つの仮説を検証
LLMベースの万能エンジニアを構築する『OpenHands(旧OpenDevin)』プラットフォーム
LLMは人間のような「共感的な対話」ができるか?実行プロンプトと検証結果

プロフィールを登録すると
仕事のオファーが届きます

プロフィール登録
PAGE TOP