次回の更新記事:ハルシネーションは「AIのせい」だけではなく「クエ…(公開予定日:2026年03月05日)

LLMアライメント民主化OASST2データセット公開

学習手法(ファインチューニング、RLHF、事前学習、instruction tuning)

📝 これは「短信」です ― AIDBリサーチチームが独自の視点で論文を紹介する、カジュアルで読みやすいコンテンツです。

LLMのアライメント民主化を目指すプロジェクトとして発足した「OpenAssistant」が、最終版の会話データセット『OASST2』をリリースしたと報告しています。

有志からの135k件のプロンプターとAIによる会話データを含んでいます。
(なお、日本語変換ツールも日本の技術者によって公開されています)

“OpenAssistant Conversations — Democratizing Large Language Model Alignment”と連携ページより

■OpenAssistantの目的と特徴
1. LLMのアライメント(※)を民主化する
(※)人間の好みや価値観に合わせること
2. 多様な会話データでLLMの品質を向上させる
3. オープンソースの理念に従っている
4. 広範なコミュニティが開発に参加している

■これまでの流れ
2023.2 プロジェクトが発足
2023.4〜 様々なモデルが公開
2023.10 プロジェクトが完了
2023.12 最終版のデータセットを提供

■公開されたデータ
– 『OASST』でチューニングされた26つのモデル
(codellama/llama2/falconなど)
– 『OASST2』を含む4つのデータセット

なお、OpenAssistantは完了とされていますが、データやコードは引き続き公開された状態になると言及されています。
また、共感に重点をおいた次のプロジェクト(OpenEmpathic)の開始も示唆されています。

📄 参照論文

■参照情報

所属: 日本語変換ツール:https://t.co/aQCkgPSLdY

関連記事