次回の更新記事:Cursorはソフトウェア開発を加速する?導入後の実態…(公開予定日:2025年11月11日)

コーディング

複雑なプログラミングタスクに特化したベンチマーク『BigCodeBench』登場 最新モデルでも60%
Self-Reflection(自己反省)がLLMのパフォーマンスに与える影響を網羅的に調査
AIコーディング補助ツール(GitHub Copilot)で開発者の生産性が26%向上 Microsoft・アクセンチュアなど3社の大規模調査結果
LLMから「LLMエージェント」へ ソフトウェアエンジニアリングにおける今後の展開
LLMベースの万能エンジニアを構築する『OpenHands(旧OpenDevin)』プラットフォーム
エージェントなしで行うLLMによるソフトウェアのバグ修正手法
自然言語プログラミングを可能にするシステム『CoRE』
LLMでプログラミング言語間の翻訳を行うプロンプト手法 C、Go→Rustのケーススタディ結果
LLMエージェントが実行可能なPythonコードを生成するフレームワーク『CodeAct』
LLMが「自然言語で記述されたアルゴリズムを実行する」能力で非常に高い性能を示す
スクショからHTMLとCSSのコードをLLMが生成する『Design2Code』タスク、プロンプト手法やファインチューニングで高い性能を確認
GPT-4のコード生成能力を飛躍的に向上させるプロンプトフレームワーク『AlphaCodium』
Geminiの高い推論能力を活かして、過去最高水準のプログラミングAI『AlphaCode 2』も誕生したとの報告
GPT-4などLLMのコード生成能力にデバッグ機能を追加する『SELF-DEBUGGING(セルフデバッギング)』と実行プロンプト
LLMがソフトウェアエンジニアリングでどのように適用可能か、網羅的な調査&分析結果

プロフィールを登録すると
仕事のオファーが届きます

プロフィール登録
PAGE TOP