LLMが長々と説明するときは自信がない傾向にある 14個のモデルで検証

本記事では、LLMが「答えに自信がない時...
Read More

LLMプロジェクト開発に必要な新しい概念「AgentOps」とは

本記事では、LLMエージェントを安全に開...
Read More

画像も文字も表も全部まとめて理解するRAGシステムの提案 Bloombergなど

本記事では、複数の文書やページから図や表...
Read More

LLMにおける長文処理能力の進化を調査 Claude 3.5は情報の流れを追跡するスキルに長ける

本記事では、LLMの長文処理能力について...
Read More

「HTMLをそのままLLMに入力してはどうか」という新しいアプローチ

本記事では、LLMの精度向上のために用い...
Read More

LLMの機能別「領域」はまるで脳のようであるとの仮説

本記事では、LLMの内部で発見された驚く...
Read More

政治・社会

開発企業や言語ごとに異なるLLMのイデオロギー、価値観や態度
米国3人に1人が生成AIを使用 ブルーカラー労働者も生産性向上 大規模調査より 
AIコーディング補助ツール(GitHub Copilot)で開発者の生産性が26%向上 Microsoft・アクセンチュアなど3社の大規模調査結果
プロンプトに5つほど”価値観の例”を示すだけで、LLMは特定の文化に適応した回答ができるようになるとの報告
LLMは与えられたペルソナ(役割)に応じてバイアスが変化することが明らかに
ChatGPTは学術論文の文章スタイルをどう変えているか?大規模な調査の結果
OpenAIが開発中の「人間を超えたAIを制御する」方法
日常能力を試すテスト『GAIA』正答率、人間92%に対してGPT-4は15% 一般的なニーズに応えるAI開発の指針に
PAGE TOP