ドメイン特化LLM
要約済み 1
-
arxiv-cs-ai 3日前 3ESA、地球科学特化の24B LLM「EVE」をOSS公開EVE: A Domain-Specific LLM Framework for Earth Intelligence
欧州宇宙機関ESAが、地球観測・地球科学に特化した24BパラメータのLLM「EVE」をオープンソースで公開。 Mistral Small 3.2ベースで構築し、地球科学ベンチマークで同規模モデルを凌駕する性能を達成。 RAGとハルシネーション検出を統合した本番システムとして350名のパイロットユーザーが既に活用中。
解説 EVE(Earth Virtual Expert)は欧州宇宙機関(ESA)が主導する、地球科学・地球観測分野に特化した大規模言語モデルのオープンソースフレームワークである。コアモデルはMistral Small 3.2(24Bパラメータ)をベースに、地球科学ドメインのコーパスでドメイン適応学習(Domain-Adapted Fine-tuning)を実施した「EVE-Instruct」で構成される。新たに構築したベンチマークはMCQA(多肢選択式問題)・オープンエンドQA・事実性評価の3種をカバーし、同規模の汎用モデルと比較して優位な性能を示した。GPT-4oやGemini等との直接比較は論文抜粋に明記されていないが、同規模(comparable)モデル群を上回るとしている。実用面では、RAG(検索拡張生成)によって最新の地球観測データや文献を参照しつつ回答精度を高め、ハルシネーション検出パイプラインで誤情報リスクを低減する二重構造を採用。APIとGUIの両方で提供され、すでに350名のパイロットユーザーが活用している。学習コーパス・評価ベンチマーク・モデル・コードをすべてオープンライセンスで公開予定であり、地球科学AIコミュニティへの貢献という観点で実用的な意義は大きい。