AIフロントライン

公式ソースだけを集めたAI最前線(日本語要約)

hf-papers 2026-04-17 00:00

Self-Distillation Zero: Self-Revision Turns Binary Rewards into Dense Supervision