次回の更新記事:世界的にみた「独自LLM」の開発状況や戦略、規制動向…(公開予定日:2025年03月14日)

業界

ChatGPTは学術論文の文章スタイルをどう変えているか?大規模な調査の結果
LLMは制御工学でどれほど能力があるか Claude 3、GPT-4、Gemini Ultraでの実験結果
LLMの化学的能力はどれほどか 最先端LLMと人間を比較した結果
「ゲームでのLLM」における調査結果 プレイヤー・NPC・ゲームマスターなど様々な役割を網羅的に整理
Googleなど、API経由でブラックボックスLLMの隠れ次元数を特定できる脆弱性を示す ※OpenAI社はこれを受け対策済み
GPT-4などのLLMがセキュリティ脆弱性とソフトウェア機能性の評価能力で高い精度を示す
スクショからHTMLとCSSのコードをLLMが生成する『Design2Code』タスク、プロンプト手法やファインチューニングで高い性能を確認
LLMの「心の理論」能力を詳しく調べるためのベンチマーク『OpenToM』 GPT-4など複数モデルの評価結果
GPT-4にRAG(検索拡張生成)を適用するケーススタディ 臨床問題で人間の医師よりも高い精度を達成
外部からの攻撃で一度でも欺瞞を学んだLLMは現在の技術では完全回復が難しい

プロフィールを登録すると
仕事のオファーが届きます

プロフィール登録
PAGE TOP