社会にAIがうまく馴染むための「アライメント」とは何か 主な手法も整理

本記事では、LLMと人間の価値観とのずれを調整する「アライメント」という考え方と、その代表的な手法を紹介します。 アライメントは、安全性や信頼性といった実用面にも関わる技術です。RLHFやConstitutional A … 続きを読む 社会にAIがうまく馴染むための「アライメント」とは何か 主な手法も整理