LLM | AIDB - Part 10

Loading [MathJax]/extensions/tex2jax.js

ホーム
過去の記事一覧

次回の更新記事：LLMエージェントで社会現象をシミュレーションするに…（公開予定日：2025年04月28日）

LLM

2024/10/18
LLM 推論モデル有料記事論文

「o1-preview」は自己評価メカニズムを持つ　計画立案中に自分の行動をチェックして修正　

「o1-preview」は自己評価メカニズムを持つ　計画立案中に自分の行動をチェックして修正　

2024/10/17
LLM RAG ファインチューニング有料記事論文長文コンテキスト

ロングコンテキストLLMでも、情報の数は「多ければ多いほど良い」わけではない

ロングコンテキストLLMでも、情報の数は「多ければ多いほど良い」わけではない

2024/10/16
LLM エージェント推論モデル有料記事論文

OpenAIのo1-previewモデル、Kaggleのグランドマスター基準を上回るデータ分析性能を発揮

OpenAIのo1-previewモデル、Kaggleのグランドマスター基準を上回るデータ分析性能を発揮

2024/10/15
LLM プロンプト有料記事論文

LLMの推論能力は単純に文脈を繰り返すだけでも大幅に向上　最大で30%改善

LLMの推論能力は単純に文脈を繰り返すだけでも大幅に向上　最大で30%改善

「あなたは〇〇です」などのペルソナ設定を与えても、事実に基づく質問への回答精度は向上しないとの主張

「あなたは〇〇です」などのペルソナ設定を与えても、事実に基づく質問への回答精度は向上しないとの主張

2024/10/10
LLM ベンチマーク有料記事論文

複雑なプログラミングタスクに特化したベンチマーク『BigCodeBench』登場　最新モデルでも60%

複雑なプログラミングタスクに特化したベンチマーク『BigCodeBench』登場　最新モデルでも60%

2024/10/8
LLM RAG 有料記事論文

ハーバード大学とGoogleの研究者ら、LLMチャットボットを総合的に評価するデータセットの作り方を報告（作成されたデータセットも公開）

ハーバード大学とGoogleの研究者ら、LLMチャットボットを総合的に評価するデータセットの作り方を報告（作成されたデータセットも公開）

100万体のLLMエージェントによるシミュレーションを実験できる環境が登場

100万体のLLMエージェントによるシミュレーションを実験できる環境が登場

2024/10/4
LLM 推論モデル有料記事論文

「o1-preview」は従来のモデルとは明確に異なり「珍しいタイプの問題」にも強い

「o1-preview」は従来のモデルとは明確に異なり「珍しいタイプの問題」にも強い

2024/10/3
LLM エージェントプロンプト有料記事論文

対話の中でユーザーの好みを学ぶ手法『CIPHER』　（プロンプトテンプレートあり）

対話の中でユーザーの好みを学ぶ手法『CIPHER』　（プロンプトテンプレートあり）

2024/10/2
LLM エージェントプロンプト有料記事論文

専門家が作成したプロンプトと同等以上の性能を達成する自動プロンプト生成手法『Minstriel』

専門家が作成したプロンプトと同等以上の性能を達成する自動プロンプト生成手法『Minstriel』

2024/10/1
LLM 政治・社会有料記事論文

米国3人に1人が生成AIを使用　ブルーカラー労働者も生産性向上　大規模調査より　

米国3人に1人が生成AIを使用　ブルーカラー労働者も生産性向上　大規模調査より　

2024/9/30
LLM プロンプト有料記事論文

LLMの論理的推論能力をステップバイステップ以上に向上させる手法『Logic-of-Thought』プロンプティング（テンプレートつき）

LLMの論理的推論能力をステップバイステップ以上に向上させる手法『Logic-of-Thought』プロンプティング（テンプレートつき）

2024/9/27
LLM 有料記事論文

RAG-LLMシステムへのユーザークエリは4つのレベルに分類できる　最も複雑なのは「隠れた根拠からの推論が必要なクエリ」Microsoftによる研究

RAG-LLMシステムへのユーザークエリは4つのレベルに分類できる　最も複雑なのは「隠れた根拠からの推論が必要なクエリ」Microsoftによる研究

2024/9/26
LLM 推論モデル有料記事論文

OpenAIの新しいモデルo1-preview、従来のLLMと比べて「計画能力」で圧倒的な性能向上

OpenAIの新しいモデルo1-preview、従来のLLMと比べて「計画能力」で圧倒的な性能向上

プロフィールを登録すると
仕事のオファーが届きます

プロフィール登録

おすすめポスト

MRI画像は、精神科におけるバイオマーカーになりえるか？…

機械学習による自閉症の早期診断ツールとは【AI×メンタル…

「海外版の検出と防止ためのＡＩシステム」が特許出願！（米…

クボタ社「農作業車のためのコスパに優れた障害物検出AIシ…

「ＡＩで加熱物が沸騰しているか判断するシステム」が特許出…

MRI画像は、精神科におけるバイオマーカーになりえるか？…

機械学習による自閉症の早期診断ツールとは【AI×メンタル…

「海外版の検出と防止ためのＡＩシステム」が特許出願！（米…

クボタ社「農作業車のためのコスパに優れた障害物検出AIシ…

「ＡＩで加熱物が沸騰しているか判断するシステム」が特許出…

MRI画像は、精神科におけるバイオマーカーになりえるか？…

機械学習による自閉症の早期診断ツールとは【AI×メンタル…

「海外版の検出と防止ためのＡＩシステム」が特許出願！（米…

クボタ社「農作業車のためのコスパに優れた障害物検出AIシ…

「ＡＩで加熱物が沸騰しているか判断するシステム」が特許出…

prev

next

Copyright © AIDB All rights reserved.