最新の記事:100ドル前後のシングルボードコンピュータでLLMは実…

有料記事

Llama 3.1シリーズ、8ビット量子化で半分以下のサイズでも性能をほぼ完全維持、実験で確認
LLMにおける長文処理能力の進化を調査 Claude 3.5は情報の流れを追跡するスキルに長ける
上司役のLLMが部下LLMたちに的確に仕事を振り分ける『Magentic-One』マイクロソフトが開発
「HTMLをそのままLLMに入力してはどうか」という新しいアプローチ
LLMの機能別「領域」はまるで脳のようであるとの仮説
直感に頼るようなタスクだとLLMに「ステップバイステップで考えて」は逆効果
LLMの「知っているのに嘘をつく」幻覚と「知らないから間違える」幻覚の違い
OpenAIが新しくLLMの事実性評価ベンチマーク『SimpleQA』をリリース 実用に役立つ知見も得られる
LLMに対するオープンソース安全性評価ツールの比較
プレイヤーの行動に応じてゲームを自動生成する技術 Googleなどが開発
手の込んだ手法よりシンプルな手法の方がLLMは幻覚を起こしにくい 問題に応じて戦略を変える必要性
開発企業や言語ごとに異なるLLMのイデオロギー、価値観や態度
コンテキスト内で重要な情報同士が離れすぎるとLLMの性能は大幅に下がる
LLMには正解例だけでなく、「よくある間違い例」と理由も一緒に教えるのが有効
o1-previewが人間のように6つの思考パターンを使い分けているとの実験結果
PAGE TOP