ユーザー保護
要約済み 1
-
anthropic-news 3ヶ月前 3Anthropic、Claudeに危機検出AIを実装Protecting the wellbeing of our users
AnthropicがClaudeに自殺・自傷の危機検出分類器を導入し、170カ国以上のホットライン連携バナー機能を公開。 Opus 4.5は単一ターンで98.6%の精度で危機対応に成功し、過度な同意(シコファンシー)も大幅削減を達成。 AIの安全・倫理設計の新基準となる可能性があり、業界全体のユーザー保護指針に影響を与えそうだ。