Loading [MathJax]/jax/output/HTML-CSS/config.js
次回の更新記事:標準作業手順書(SOP)をもとにLLMエージェントシス…(公開予定日:2025年03月31日)

LLM

ソフトウェア評価にLLMを活用する「LLM-as-a-Judge」における現状
LLMアプリケーション(LLMを利用したシステム)の安全評価方法・レッドチーミングの進め方
LLM評価の盲点とそれを解消する手法
LLMはシステムプロンプトをどれほど守れるか
自然言語タスクをコードタスクに変換してLLMに高度な推論を実行させる
LLMのアンサンブル(組み合わせ)で重要なのは多様性か、それとも優秀さか。
LLMにキャラクターの話し方だけでなく「キャラ独自の内面の思考プロセス」も模倣させる手法
Claude 3.7 Sonnet その安全性と性能
会議出席代行システム LLMでどこまでできるか
LLM科学者と人間の協力で実験の効率化 Googleなど
100万ドル分のソフトウェアエンジニアリングタスクで最先端のLLMを検証 40%まで達成
「LLM活用で文書作成」社会でどこまで導入されている
LLMを擬人化することに対する見解
LLM専用の「新しい言葉」を導入 Google DeepMind
「すべてのソフトウェアをエージェントとして使う」ビジョンと実践例

プロフィールを登録すると
仕事のオファーが届きます

プロフィール登録
PAGE TOP