LEGAL
AIガバナンス声明
最終更新日:2026年5月24日
唯心(Yuishin)は、AIによる自動モデレーションを「人を裁くため」ではなく「人が安心して話せる場を守るため」に利用するという原則のもと、本声明を制定しております。本ページは、当社が AI をどのように用い、何をしておらず、誤判定にどう対応するかを透明に示すものでございます。
1. AIモデレーションの目的
当社のAIモデレーションは、以下の3点のみを目的としております。
- 投稿者本人を含む利用者の個人情報(住所、電話番号、メールアドレス、ナンバープレート等)の意図せぬ流出の予防
- 明らかな誹謗中傷・差別的表現・脅迫的言動の検出
- 皮肉や嫌味を建設的批判と区別する補助的判断材料の提供
言論内容そのものの是非、政治的立場、宗教的信条、個人の生き方に関する判断は、AIモデレーションの対象外でございます。
2. 使用するAIモデル
本サービスは現在、Anthropic 社の Claude モデル(haiku 系列)を主たる検査エンジンとして使用しております。モデルは予告なく変更される可能性がございますが、変更時には本ページにて告知いたします。
主モデル: Claude Haiku 系列(投稿前事前検査用)
補助モデル: 同社の正規モデルを必要に応じて使用
提供事業者: Anthropic, PBC(米国)
本サービスは Anthropic 社との API 利用契約に基づき、送信内容は審査後即時破棄され、モデル訓練には使用されない契約となっております。
3. 検査項目と判定基準
AIは以下のラベルのいずれかを各投稿に付与いたします。
4. 自動処理の範囲
AIが自動で実行できるのは以下のみでございます。
- 住所、電話番号、ナンバープレート等の自動ぼかし処理
- 「AI 警告」判定により、投稿前にユーザーへ確認を要求
- 「AI 要注意」マークの付与(投稿の表示は妨げない)
AIは以下を自動的に行いません。
- 投稿者のアカウント凍結・BAN
- すでに公開された投稿の削除
- 当局への通報
- 利用者間の個別の紛争の裁定
5. 人による最終判断
AIの判定結果に疑義がある場合、または「AI 警告」と判定された投稿について、利用者は人による再審査を申請する権利を有します。再審査は当社のモデレーション担当者が行い、原則として3営業日以内に結論を通知いたします。
AIの判定がモデレーションの「最終決定」とはならず、必ず人間の判断機会が残されるという原則を、当社は技術設計と運用の両面で堅持してまいります。
6. AIに送信されるデータの範囲
AI事前検査においては、投稿の件名と本文のテキストのみが Anthropic API に送信されます。利用者ID、メールアドレス、IPアドレス、セッション識別子、過去の投稿履歴、その他のメタデータは一切送信されません。
送信されるテキストは、まず当社のサーバー側で「プロンプトインジェクション」対策の浄化処理を施したうえで、明示的な境界マーカーで囲まれた状態で送信されます。これは、悪意ある利用者がAIの判定を覆そうとする試みから本サービス全体を防御するための措置でございます。
7. 誤判定への対応
AIは絶対的に正しい判断を下す存在ではございません。当社は以下を約束いたします。
- 誤判定により投稿が妨げられた場合、人による再審査の機会を保証する
- 系統的な誤判定パターンが確認された場合、システムプロンプトおよびモデルの調整を行う
- 四半期ごとに誤判定率の概況を本ページにて公表する(2026年第3四半期より開始予定)
8. AIモデレーションログの開示
AIが行った処理は、ダッシュボード上の「AIモデレーション記録」セクションにて利用者へ公開しております。具体的にどの投稿に対していつ何を行ったかは、ご自身の投稿に関する範囲で確認可能でございます。透明性を維持するための重要な仕組みと位置付けております。
9. 本声明の改訂
AI技術の進化、運用上の知見の蓄積、利用者からのフィードバック等に応じて、本声明は適宜改訂されます。重要な変更につきましては、本サービス上で告知のうえ施行いたします。