GPT-4を監視・評価するAI「Shepherd」

2023.08.11

評価・ベンチマーク（モデル評価、ベンチマーク、性能測定）

📝 これは「短信」です ― AIDBリサーチチームが独自の視点で論文を紹介する、カジュアルで読みやすいコンテンツです。

Metaの研究者らによって「GPT-4をきびしくサポートする」AIのShepherd（シェパード）が開発されました。

○ Tianlu Wanget al. Shepherd: A Critic for Language Model Generation

GPT-4の出力が「正しいのか」「信頼性があるのか」「一貫性があるのか」を監視する専門のAIモデルが登場しました。

人間によるフィードバックとオンラインフォーラムから収集したデータから学習し、「出力の批評」に対する汎用的な能力を獲得しています。

実験では他のモデルよりも大幅に優れたパフォーマンスを見せています。

論文：https://t.co/Nrgq0vXVbV

📎 論文を読む（arxiv.org）

こちらもどうぞ