open-weight
要約済み 2
-
hf-blog 3日前 4H Company、PC操作AIでSOTA更新——GPT-5.4超えHolo3: Breaking the Computer Use Frontier
H CompanyがGUI操作エージェント「Holo3」をApache 2.0ライセンスで公開した。 35Bパラメータ(活性10B)ながらOSWorld-Verifiedで78.85%を達成し、GPT-5.4やClaude Opus 4.6を上回る。 合成データと強化学習の3段階パイプラインで企業向けマルチアプリ自動操作を実現し、小規模モデルの可能性を示した。
解説 デスクトップ操作(Computer Use)領域でSOTAを更新した点が重要。10Bの活性パラメータでOpus 4.6やGPT-5.4等の大規模モデルを上回り、コスト効率の高いエージェントの実現可能性を示した。Apache 2.0公開によりオープンソースのGUIエージェント開発が加速する見込み。企業向けマルチアプリワークフロー自動化という実用的なユースケースに焦点を当てており、RPA代替として開発者・研究者双方に影響が大きい。 -
hf-blog 7日前 3Darwin V6、進化的アルゴリズムでモデルマージを刷新Darwin V6: Diagnostic-Guided Evolutionary Model Merging4 days ago•11
診断誘導型の進化的モデルマージ手法「Darwin V6」が発表された。 テンソル単位の静的解析とCMA-ES進化アルゴリズムで最適なマージ比率を自動探索し、GPQA Diamondで+5.8%の性能向上を達成。 均一マージに依存してきたモデル統合の手法を根本から見直す新たなパラダイムを提示した。
解説 従来のmergekitが全テンソルに均一比率を適用するのに対し、Darwin V6はShannon entropyや機能プローブによる診断で各テンソルの最適マージ比率を独立決定する。CMA-ES進化探索と直接移植(補間なし)を組み合わせ、Qwen 3.5やGemma 4ベースでGPQA Diamond 90%等を達成。GPT-4oやClaude等の商用モデルとは直接競合しないが、オープンウェイトモデルの性能向上手法として開発者・研究者に実用的な示唆を与える。