プロンプトに応じLLMを最適選択するTryage

2023.08.25

エージェント（AIエージェント、ツール使用、自律的なタスク実行、MCP、computer use）

📝 これは「短信」です ― AIDBリサーチチームが独自の視点で論文を紹介する、カジュアルで読みやすいコンテンツです。

言語モデルが増えすぎたので、プロンプトに応じてモデルを選択するフレームワークをカリフォルニア工科大の研究者らが開発しました。

○ Surya Narayanan Hari et al. Tryage: Real-time, intelligent Routing of User Prompts to Large Language Models

研究者らは、今必要な一手として、ユーザー支援システム「Tryage」を構築しました。

Tryageはプロンプトの文脈を読み取り、下記の基準で複数の言語モデルから最適なものをレコメンドします。

■タスク達成の精度
■モデルサイズ
■最新性
■セキュリティ

上記からどの基準を重視するかを考えて、パフォーマンスのトレードオフを自動で行います。

実験ではコード生成、テキスト生成、臨床データ処理、特許処理などのテーマで高い精度を記録したとのことです。

なお本システムは人間の脳における視床の働きに注目し、機能を模倣したとのことです。
視床は、大脳皮質への感覚情報の中継や、意識と覚醒の調節などを行う構造を持つ脳領域です。

論文：https://t.co/u0oJQKjkse

📎 論文を読む（arxiv.org）

こちらもどうぞ