次回の更新記事:LLM評価の盲点とそれを解消する手法(公開予定日:2025年02月26日)

投稿者の過去記事

自分の話し声を別の誰かの声にリアルタイム変換するモデルが、一般消費者向けCPUで動かせる軽さで登場
「自分を信じて限界を超えてください」など感情を込めたプロンプト『EmotionPrompt』が添えられると、ChatGPTなどLLMのパフォーマンスは向上する
現時点でのLLMに対する網羅的な評価分析が行われました。
約1.7万件におよぶLLM論文を調査した結果からわかる現在のLLM研究トレンド arXiv運営のコーネル大より発表
人間とGPT-4の社会的知能を測定するツール『SOTOPIA』登場 GPT-4は秘密を守る力で人間より優れるとの結果も
従来の小さなニューラルネットワークでも「メタ学習」でChatGPTを凌駕するほど高度な生成AIができるとの報告、Nature誌
GPT-4などLLMのコード生成能力にデバッグ機能を追加する『SELF-DEBUGGING(セルフデバッギング)』と実行プロンプト
LLMに非線形的な思考を与えてCoTを上回る性能を引き出す手法『IEP』と実行プロンプト CoTと組合せでさらに強力になる場合も
Natureなどの論文約4,800本でGPT-4による査読能力が検証され、「LLMは査読にも有用」と結論
DALL-E 3はどうしてユーザーの意図を正確に汲み取ることができるのか?OpenAIが論文で発表

プロフィールを登録すると
仕事のオファーが届きます

プロフィール登録
PAGE TOP