AIフロントライン

公式ソースだけを集めたAIニュースを日本語要約でお届け

Sentence Transformers

1件の記事

要約済み 1

hf-blog 3日前 3
Sentence Transformers v5.4、テキスト・画像・音声・動画を統一APIで埋め込み対応
Multimodal Embedding & Reranker Models with Sentence Transformers

Sentence Transformers v5.4がリリースされ、テキスト・画像・音声・動画を単一APIで埋め込み可能に。 Qwen3-VLなど最新マルチモーダルモデルを活用したクロスモーダル検索・リランキングを実装。 Retrieve & Rerankパイプラインにより、RAGシステムの検索精度向上が期待される。

解説 Sentence Transformersという広く使われるライブラリにマルチモーダル対応が統合された実用的なアップデート。Qwen3-VL、NVIDIA Nemotron、BGE-VL等の最新埋め込み・リランクモデルを統一APIで利用可能になり、RAGパイプラインへのマルチモーダル検索導入が大幅に容易になる。GPT-4oやClaude等のLLMとは異なり、検索・類似度計算に特化した軽量モデル群であり、開発者が既存の検索基盤に画像・動画対応を追加する際の実践的な選択肢となる。

マルチモーダル埋め込みモデル Sentence Transformers リランキング RAG