LEGAL

AIガバナンス声明

最終更新日:2026年5月24日

唯心(Yuishin)は、AIによる自動モデレーションを「人を裁くため」ではなく「人が安心して話せる場を守るため」に利用するという原則のもと、本声明を制定しております。本ページは、当社が AI をどのように用い、何をしておらず、誤判定にどう対応するかを透明に示すものでございます。

1. AIモデレーションの目的

当社のAIモデレーションは、以下の3点のみを目的としております。

  • 投稿者本人を含む利用者の個人情報(住所、電話番号、メールアドレス、ナンバープレート等)の意図せぬ流出の予防
  • 明らかな誹謗中傷・差別的表現・脅迫的言動の検出
  • 皮肉や嫌味を建設的批判と区別する補助的判断材料の提供

言論内容そのものの是非、政治的立場、宗教的信条、個人の生き方に関する判断は、AIモデレーションの対象外でございます。

2. 使用するAIモデル

本サービスは現在、Anthropic 社の Claude モデル(haiku 系列)を主たる検査エンジンとして使用しております。モデルは予告なく変更される可能性がございますが、変更時には本ページにて告知いたします。

主モデル: Claude Haiku 系列(投稿前事前検査用)

補助モデル: 同社の正規モデルを必要に応じて使用

提供事業者: Anthropic, PBC(米国)

本サービスは Anthropic 社との API 利用契約に基づき、送信内容は審査後即時破棄され、モデル訓練には使用されない契約となっております。

3. 検査項目と判定基準

AIは以下のラベルのいずれかを各投稿に付与いたします。

AI 安全検出すべき問題が発見されなかった投稿。公開可。
AI 検証済識別可能な著者(部分匿名・実名)による投稿で、AI検査を通過したもの。
AI 要注意皮肉・建設的批判の境界事例。公開はされるが要注意マークが付く。
AI 警告個人情報・攻撃的表現・プロンプトインジェクションの試行が検出された投稿。公開前にユーザー側の確認を要求。

4. 自動処理の範囲

AIが自動で実行できるのは以下のみでございます。

  • 住所、電話番号、ナンバープレート等の自動ぼかし処理
  • 「AI 警告」判定により、投稿前にユーザーへ確認を要求
  • 「AI 要注意」マークの付与(投稿の表示は妨げない)

AIは以下を自動的に行いません。

  • 投稿者のアカウント凍結・BAN
  • すでに公開された投稿の削除
  • 当局への通報
  • 利用者間の個別の紛争の裁定

5. 人による最終判断

AIの判定結果に疑義がある場合、または「AI 警告」と判定された投稿について、利用者は人による再審査を申請する権利を有します。再審査は当社のモデレーション担当者が行い、原則として3営業日以内に結論を通知いたします。

AIの判定がモデレーションの「最終決定」とはならず、必ず人間の判断機会が残されるという原則を、当社は技術設計と運用の両面で堅持してまいります。

6. AIに送信されるデータの範囲

AI事前検査においては、投稿の件名と本文のテキストのみが Anthropic API に送信されます。利用者ID、メールアドレス、IPアドレス、セッション識別子、過去の投稿履歴、その他のメタデータは一切送信されません。

送信されるテキストは、まず当社のサーバー側で「プロンプトインジェクション」対策の浄化処理を施したうえで、明示的な境界マーカーで囲まれた状態で送信されます。これは、悪意ある利用者がAIの判定を覆そうとする試みから本サービス全体を防御するための措置でございます。

7. 誤判定への対応

AIは絶対的に正しい判断を下す存在ではございません。当社は以下を約束いたします。

  • 誤判定により投稿が妨げられた場合、人による再審査の機会を保証する
  • 系統的な誤判定パターンが確認された場合、システムプロンプトおよびモデルの調整を行う
  • 四半期ごとに誤判定率の概況を本ページにて公表する(2026年第3四半期より開始予定)

8. AIモデレーションログの開示

AIが行った処理は、ダッシュボード上の「AIモデレーション記録」セクションにて利用者へ公開しております。具体的にどの投稿に対していつ何を行ったかは、ご自身の投稿に関する範囲で確認可能でございます。透明性を維持するための重要な仕組みと位置付けております。

9. 本声明の改訂

AI技術の進化、運用上の知見の蓄積、利用者からのフィードバック等に応じて、本声明は適宜改訂されます。重要な変更につきましては、本サービス上で告知のうえ施行いたします。

以上