オープンモデル
要約済み 2
-
hf-blog 7日前 3Codexが3万論文OCRを自律設計、コスト半減How we OCR'ed 30,000 papers using Codex, open OCR models and Jobs4 days ago•39
arXiv上のHTML未対応論文3万件をMarkdownへ変換するOCRパイプラインをOpenAI Codexが自律的に構築。 オープンOCRモデルとHugging Face Jobsを組み合わせ、処理コストを約850ドルに抑えAPI比最大68%削減。 LLMによるインフラ設計・実行の自動化が示され、研究データ整備の新たな手法として注目される。
解説 Chandra-OCR 2(5Bパラメータ)とHugging Face Jobsの組み合わせで、3万件の論文PDFを約24時間・850ドルでMarkdown化した実践事例。AIコーディングエージェント(Codex)がパイプライン設計からGPU選定、並列ジョブ監視まで自律実行した点が注目される。GPT-4oやClaude等のプロプライエタリAPIに頼らず、オープンモデルで大規模OCRが実用水準に達したことを示しており、研究基盤の民主化に貢献する。 -
gh-mistral 1年前 3MistralとNVIDIA、12Bモデル「Nemo」を共同リリースmistralai/mistral-inference v1.3.0 Mistral-Nemo
MistralとNVIDIAが共同開発した12Bパラメータの大規模言語モデル「Mistral Nemo」を正式公開。 mistral-inference v1.3.0で利用可能で、CLIとPython APIの両方に対応し即時利用が可能。 中規模モデルとして実用性と性能を両立、オープンなエコシステムへの貢献が期待される。