次回の更新記事:AIコーディングエージェントのコスト構造を読み解く(公開予定日:2026年05月26日)
AIDB Daily Papers

Product Huntのローンチ情報からシリーズA資金調達を予測するベンチマーク「PHBench」

原題: PHBench: A Benchmark for Predicting Startup Series A Funding from Product Hunt Launch Signals
著者: Yagiz Ihlamur, Ben Griffin, Rick Chen
公開日: 2026-05-03 | 分野: LLM ベンチマーク 機械学習 cs.LG q-fin.PR 資金調達 スタートアップ Product Hunt

※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。

ポイント

  • Product Huntのローンチ情報に含まれる構造化されたシグナルが、シリーズA資金調達の成果を予測する上で統計的に有意な情報を持つことを示しました。
  • 本研究では、2019年から2025年までの67,292件のProduct Hunt投稿とCrunchbaseの資金調達記録を紐付け、ローンチ後18ヶ月以内のシリーズA調達を528件特定し、PHBenchというベンチマークを構築しました。
  • 最良のモデルはF0.5=0.097、AP=0.037を達成し、ゼロショットのGeminiモデルよりも優れた性能を示しましたが、モデルの性能は市場の変動と連動して低下する傾向が見られました。

Abstract

Structured launch signals on Product Hunt contain statistically significant predictive information for Series A funding outcomes. We construct PHBench from 67,292 featured Product Hunt posts spanning 2019-2025, linked to Crunchbase funding records via deterministic domain matching, identifying 528 verified Series A raises within 18 months of launch (positive rate: 0.78%). Our best-performing model, a three-component ensemble (ENS_avg, ENS_ISO, XGB) selected by validation F0.5, achieves F0.5 = 0.097 and AP = 0.037 (95% CI: 0.024-0.072; 4.7x lift over random) on the private held-out test set (103 positives). A paired bootstrap confirms a statistically credible advantage over the logistic regression baseline (AP delta: +0.013, 95% CI: [0.004, 0.039], p < 0.001; F0.5 delta: +0.056, 95% CI: [0.006, 0.122], p = 0.016). Validation-set metrics (F0.5 = 0.284, AP = 0.126) reflect best-of-144 selection bias on 53 positives and are reported for benchmark reproducibility only. We further evaluate three zero-shot Gemini models (Gemini 2.5 Flash, Gemini 3 Flash, and Gemini 3.1 Pro) in an anonymized numerical setting. The best LLM achieves AP = 0.034 (Gemini 3 Flash), below the LR baseline AP of 0.044. Notably, the most capable Gemini variant (Gemini 3.1 Pro, AP = 0.023) performs worst -- an unexpected pattern that warrants further investigation across providers and prompting strategies. Both ML and LLM models show the same temporal performance decay tracking the 2020-2021 funding boom and subsequent contraction, confirming the dataset captures genuine market structure rather than noise. PHBench provides a reproducible framework comprising public training, validation, and blind test splits; 61 engineered features; a five-metric evaluation harness; and a public leaderboard at https://phbench.com. All code, baseline models, and anonymized dataset splits are publicly available.

Paper AI Chat

この論文のPDF全文を対象にAIに質問できます。

質問の例:

AIチャット機能を利用するには、ログインまたは会員登録(無料)が必要です。

会員登録 / ログイン

💬 ディスカッション

ディスカッションに参加するにはログインが必要です。

ログイン / アカウント作成 →

関連するAIDB記事