AIDBは、AI活用のノウハウ獲得や技術動向の調査のために、個人やチームが論文を探す・読む・活かす作業をサポートするプラットフォームです。なお、記事や投稿は人の手で書いています。

検索対象: 記事(1,020件) 短信(756件) 🔒 論文(31,173件) 🔒

Webページの見た目や使い勝手をLLMに診断させるプロンプト手法

2025.12.042026.01.27

深堀り解説

本記事では、マルチモーダルLLMを活用してWebページの視覚的複雑さを評価するプロンプト手法の開発事例をご紹介します。

単純に「このページは複雑ですか？」と尋ねるだけでは、判断の精度が非常に低く、人間の評価と一致しないという課題があります。この問題を解決するため、人間の評価者を模倣した評価を行うプロンプト手法が開発されました。

背景

Webサイトでは、ページのデザイン改善が日々実施されています。たとえば広告の配置を変えたり、商品画像のサイズを調整したりと、さまざまなバリエーションが試されています。

このような状況で課題となるのが、「視覚的複雑さ」です。これは、ページを見た際にユーザーが感じる情報処理の負担のことを指します。ページに要素が詰め込みすぎていたり、色使いが派手すぎたりすると、ユーザーは必要な情報を見つけにくくなり、結果として購買意欲が下がってしまう可能性があります。

通常、この視覚的な使い勝手の評価には、主に二つの手法が用いられます。一つは、UXデザイナーや調査担当者といった専門家による目視での評価です。もう一つはA/Bテストと呼ばれる手法で、異なるデザインを実際のユーザーに提示し、どちらのバージョンがより高い購買行動につながるかを比較するものです。

しかし、専門家による評価は高い精度が期待できますが、すべてのページバリエーションをチェックするには時間もコストもかかりすぎます。一方、A/Bテストではユーザーの実際の行動を測定できるものの、「なぜ特定のデザインがうまく機能しなかったのか」といった視覚的な理由までは明らかにできません。

そこで注目されているのが、マルチモーダルLLMの活用です。テキストだけでなく画像も処理できるモデルを用いれば、Webページのスクリーンショットを見せることで、人間のように視覚的な評価が可能になるのではないかと期待されています。

とはいえ、課題があります。たとえば「ハルシネーション」と呼ばれる、実際とは異なる情報を生成してしまう問題があります。視覚的複雑さのように主観的な判断が求められる場合、この問題はさらに深刻になります。また、モデルがどのような基準で評価を行っているのかが不明確であり、その判断の根拠を理解しにくいという点も課題です。

そこで本記事では、モデル本体には手を加えず、プロンプトの設計を工夫することで評価精度を高めるアプローチに着目しました。モデルに段階的な分析プロセスを踏ませることで、人間に近い視点での評価を引き出すことを目指しています。

プレミアム会員限定コンテンツです

無料会員でもできること

一部記事の閲覧
研究紹介短信ライブラリの基本機能

プレミアム会員の特典

全過去記事の無制限閲覧
専門家による最新リサーチ結果を記事で購読（平日毎日更新）
日本語検索対応の新着AI論文データベース
研究紹介短信ライブラリの高度な機能を開放
記事内容質問AIを使用可能に

まずはアカウントを作成

ログイン

プレミアム会員について

💬 プレミアム会員ディスカッション

ディスカッションに参加するにはログインが必要です。

ログイン / アカウント作成 →

Webページの見た目や使い勝手をLLMに診断させるプロンプト手法

背景

💬 プレミアム会員ディスカッション

記事検索

こちらもどうぞ

LLMの「頑固な知識」を変えることができるコンテキスト内編集手法（中国科学院大学Baolong Bi氏）

AIエージェントだけのSNSでわかったこと　ほか、週末読みたいAI科学ニュース

背景

💬 プレミアム会員ディスカッション

記事検索

こちらもどうぞ

LLMの「頑固な知識」を変えることができるコンテキスト内編集手法（中国科学院大学Baolong Bi氏）

AIエージェントだけのSNSでわかったこと ほか、週末読みたいAI科学ニュース

AIエージェントだけのSNSでわかったこと　ほか、週末読みたいAI科学ニュース