データセット
要約済み 2
-
hf-papers 12時間前 3論文→スライド自動変換AIフレームワーク「ArcDeck」公開Narrative-Driven Paper-to-Slide Generation via ArcDeck
研究論文を一貫したナラティブフローを保ちながらスライドへ自動変換するマルチエージェントフレームワーク「ArcDeck」が発表された。 修辞構造理論(RST)で談話構造を解析し、既存手法PPTAgentに対して100%の勝率を達成。 評価用データセット「ArcBench」も同時公開され、プレゼン資料作成の自動化研究に新たな基準を提示した。
解説 ArcDeckは、学術論文をPPTXスライドへ自動変換するマルチエージェントフレームワークである。既存手法がスライド間のナラティブ一貫性を軽視していた課題を、修辞構造理論(RST)による談話解析で解決する点が最大の特徴だ。 フレームワークは2段階で構成される。「アウトライン生成段階」では、(1)論文の各セクションをRST談話ツリーに変換する談話パーサー、(2)発表時間・対象聴衆などを元に発表全体の方針書(グローバルコミットメント)を生成するコミットメントビルダー、(3)批評・判断・修正を最大3回繰り返すナラティブ精錬ループが連携してスライド構成を決定する。「スライド生成段階」では14種のレイアウトテンプレートとpython-pptxを用いてPPTXファイルを出力する。 比較実験ではGPT-4oおよびGPT-5を生成モデルとし、HTML生成・PPTAgent・Paper2Poster・SlideGenと比較。ナラティブフローでPPTAgentに100%の勝率、SlideGenに対し48〜81%の勝率を達成した。アブレーション実験ではRSTパーサーやグローバルコミットメントを除去すると性能が有意に低下し、各コンポーネントの有効性が確認された。またCVPRやNeurIPSなどトップ学会の口頭発表論文100件から構築したArcBenchデータセットも公開され、今後の研究基盤となる。 -
arxiv-cs-ai 2日前 3LLMで論文フィードバックを自動生成、ICLR1.9万件で学習GoodPoint: Learning Constructive Scientific Paper Feedback from Author Responses
研究チームがLLMを用いて科学論文への建設的フィードバックを自動生成する手法「GoodPoint」を発表。 ICLR論文約1.9万件の著者応答データを活用し、有効性と著者行動の2軸でフィードバックを評価・最適化。 査読の質向上や研究者の負担軽減につながる可能性があり、AI支援レビューの実用化に前進。
解説 本研究は、LLMによる科学論文フィードバック自動生成を「建設的なフィードバック生成」タスクとして定式化した。従来の研究がフィードバックの品質評価を人手や汎用メトリクスに頼っていたのに対し、本手法は実際の著者応答(author responses)を正解シグナルとして活用する点が新しい。 評価軸は2つ:(1) 有効性(validity)=フィードバックが論文の実際の問題点を指摘しているか、(2) 著者行動(author action)=著者がそのフィードバックに応答・対応したか。これらの軸でICLR投稿論文1.9万件のレビューをアノテーションしたGoodPoint-ICLRデータセットを構築。 GoodPointの学習レシピは2段階:まず有効かつ実行可能なフィードバックでファインチューニングし、次にリアル・合成の選好ペアを用いた選好最適化(DPO相当)を適用する。ベンチマーク(ICLR論文1,200件)での評価では、ベースのLLMやGPT-4oなどの既存モデルと比較して、著者行動を誘発するフィードバックの生成率が向上。研究者の作業を代替するのではなく支援するという倫理的姿勢も明示されており、ピアレビュー支援AIの実用化に向けた現実的なアプローチを示す。