AIフロントライン

公式ソースだけを集めたAIニュースを日本語要約でお届け

ユーザー保護

1件の記事

要約済み 1

anthropic-news 3ヶ月前 3
Anthropic、Claudeに危機検出AIを実装
Protecting the wellbeing of our users

AnthropicがClaudeに自殺・自傷の危機検出分類器を導入し、170カ国以上のホットライン連携バナー機能を公開。 Opus 4.5は単一ターンで98.6%の精度で危機対応に成功し、過度な同意（シコファンシー）も大幅削減を達成。 AIの安全・倫理設計の新基準となる可能性があり、業界全体のユーザー保護指針に影響を与えそうだ。

Anthropic AI安全性ユーザー保護