ワイン風味の学習データセット「WineSensed」公開

2023.09.04

データ（データセット構築、合成データ、データ拡張）

📝 これは「短信」です ― AIDBリサーチチームが独自の視点で論文を紹介する、カジュアルで読みやすいコンテンツです。

見た目、産地、アルコール度数、価格、ぶどうの種類、レビュー等からなる「ワインの大規模データセット」が誕生しました。
”ワインの風味”を追究するためです。
カリフォルニア工科大学やVivino（ワインのマーケットプレイス企業）等による共同研究です。

○ Thoranna Bender et al. Learning to Taste: A Multimodal Wine Dataset

複雑な要素が絡み合うワイン研究をサポートする大規模データセット『WineSensed』が開発されました。

■『WineSensed』に含まれるデータ
① 約90万件のワインラベル画像
② 約82万件のワインのレビュー
③ 256人の参加者によるワインの風味アノテーション
④ 属性（産地、アルコール度数、価格、ぶどうの種類など）

この研究の画期的な点は、ワインに関するデータセットを作成したことではなく、風味という「まだ十分に研究されていないもの」の科学的知見を深めていることです。

■風味アノテーションのノウハウ
消費者調査や感覚評価においてよく使用される「Napping」手法が用いられました。あるワインの風味が、他のワインにどれほど似ているかを評価します。

■実験結果
① 風味の表現精度が向上
② 本データセットで訓練されたモデルは人間の風味認識と高い整合性を持つ出力を行う

ワイン以外の食品や飲料の研究にも応用可能な研究スキームと考えられ、産業の発展に貢献することが期待されます。
新製品の開発やマーケティング戦略、さらには個々の消費者の好みに合わせたレコメンド機能に役立つかもしれません。

論文タイトル：Learning to Taste: A Multimodal Wine Dataset

著者: 著者：Thoranna Bender, Simon Møe Sørensen, Alireza Kashani, K. Eldjarn Hjorleifsson, Grethe Hyldig 他

こちらもどうぞ