Metaの研究者らによって「GPT-4をきびしくサポートする」AIのShepherd(シェパード)が開発されました。
○ Tianlu Wanget al. Shepherd: A Critic for Language Model Generation
GPT-4の出力が「正しいのか」「信頼性があるのか」「一貫性があるのか」を監視する専門のAIモデルが登場しました。
人間によるフィードバックとオンラインフォーラムから収集したデータから学習し、「出力の批評」に対する汎用的な能力を獲得しています。
実験では他のモデルよりも大幅に優れたパフォーマンスを見せています。