LLM | AIDB - Part 9

Loading [MathJax]/jax/output/HTML-CSS/config.js

ホーム
過去の記事一覧

次回の更新記事：LLMを用いて「記事や投稿に潜むバイアスの検出と修正…（公開予定日：2025年04月15日）

LLM

2024/10/24
LLM 推論モデル有料記事論文

o1-previewが人間のように6つの思考パターンを使い分けているとの実験結果

o1-previewが人間のように6つの思考パターンを使い分けているとの実験結果

2024/10/23
LLM オープンソース有料記事論文

IBMから日本語対応の商用可能オープンソースLLM「GRANITE 3.0」公開　8Bから

IBMから日本語対応の商用可能オープンソースLLM「GRANITE 3.0」公開　8Bから

2024/10/22
LLM エージェント有料記事論文

計画のステップが増えるほど、LLMは最初の目標を見失っていく傾向がある

計画のステップが増えるほど、LLMは最初の目標を見失っていく傾向がある

2024/10/21
LLM ベンチマークマルチモーダル有料記事論文

500以上の実世界のマルチモーダルタスクを含む、過去最大規模の評価ベンチマーク『MEGA-BENCH』登場

500以上の実世界のマルチモーダルタスクを含む、過去最大規模の評価ベンチマーク『MEGA-BENCH』登場

2024/10/18
LLM 推論モデル有料記事論文

「o1-preview」は自己評価メカニズムを持つ　計画立案中に自分の行動をチェックして修正　

「o1-preview」は自己評価メカニズムを持つ　計画立案中に自分の行動をチェックして修正　

2024/10/17
LLM RAG ファインチューニング有料記事論文長文コンテキスト

ロングコンテキストLLMでも、情報の数は「多ければ多いほど良い」わけではない

ロングコンテキストLLMでも、情報の数は「多ければ多いほど良い」わけではない

2024/10/16
LLM エージェント推論モデル有料記事論文

OpenAIのo1-previewモデル、Kaggleのグランドマスター基準を上回るデータ分析性能を発揮

OpenAIのo1-previewモデル、Kaggleのグランドマスター基準を上回るデータ分析性能を発揮

2024/10/15
LLM プロンプト有料記事論文

LLMの推論能力は単純に文脈を繰り返すだけでも大幅に向上　最大で30%改善

LLMの推論能力は単純に文脈を繰り返すだけでも大幅に向上　最大で30%改善

「あなたは〇〇です」などのペルソナ設定を与えても、事実に基づく質問への回答精度は向上しないとの主張

「あなたは〇〇です」などのペルソナ設定を与えても、事実に基づく質問への回答精度は向上しないとの主張

2024/10/10
LLM ベンチマーク有料記事論文

複雑なプログラミングタスクに特化したベンチマーク『BigCodeBench』登場　最新モデルでも60%

複雑なプログラミングタスクに特化したベンチマーク『BigCodeBench』登場　最新モデルでも60%

2024/10/8
LLM RAG 有料記事論文

ハーバード大学とGoogleの研究者ら、LLMチャットボットを総合的に評価するデータセットの作り方を報告（作成されたデータセットも公開）

ハーバード大学とGoogleの研究者ら、LLMチャットボットを総合的に評価するデータセットの作り方を報告（作成されたデータセットも公開）

100万体のLLMエージェントによるシミュレーションを実験できる環境が登場

100万体のLLMエージェントによるシミュレーションを実験できる環境が登場

2024/10/4
LLM 推論モデル有料記事論文

「o1-preview」は従来のモデルとは明確に異なり「珍しいタイプの問題」にも強い

「o1-preview」は従来のモデルとは明確に異なり「珍しいタイプの問題」にも強い

2024/10/3
LLM エージェントプロンプト有料記事論文

対話の中でユーザーの好みを学ぶ手法『CIPHER』　（プロンプトテンプレートあり）

対話の中でユーザーの好みを学ぶ手法『CIPHER』　（プロンプトテンプレートあり）

2024/10/2
LLM エージェントプロンプト有料記事論文

専門家が作成したプロンプトと同等以上の性能を達成する自動プロンプト生成手法『Minstriel』

専門家が作成したプロンプトと同等以上の性能を達成する自動プロンプト生成手法『Minstriel』

プロフィールを登録すると
仕事のオファーが届きます

プロフィール登録

おすすめポスト

MRI画像は、精神科におけるバイオマーカーになりえるか？…

機械学習による自閉症の早期診断ツールとは【AI×メンタル…

「海外版の検出と防止ためのＡＩシステム」が特許出願！（米…

クボタ社「農作業車のためのコスパに優れた障害物検出AIシ…

「ＡＩで加熱物が沸騰しているか判断するシステム」が特許出…

MRI画像は、精神科におけるバイオマーカーになりえるか？…

機械学習による自閉症の早期診断ツールとは【AI×メンタル…

「海外版の検出と防止ためのＡＩシステム」が特許出願！（米…

クボタ社「農作業車のためのコスパに優れた障害物検出AIシ…

「ＡＩで加熱物が沸騰しているか判断するシステム」が特許出…

MRI画像は、精神科におけるバイオマーカーになりえるか？…

機械学習による自閉症の早期診断ツールとは【AI×メンタル…

「海外版の検出と防止ためのＡＩシステム」が特許出願！（米…

クボタ社「農作業車のためのコスパに優れた障害物検出AIシ…

「ＡＩで加熱物が沸騰しているか判断するシステム」が特許出…

prev

next

Copyright © AIDB All rights reserved.