LEGAL

AIガバナンス声明

最終更新日:2026年5月24日

唯心(Yuishin)は、AIによる自動モデレーションを「人を裁くため」ではなく「人が安心して話せる場を守るため」に利用するという原則のもと、本声明を制定しております。本ページは、当社が AI をどのように用い、何をしておらず、誤判定にどう対応するかを透明に示すものでございます。

1. AIモデレーションの目的

当社のAIモデレーションは、以下の3点のみを目的としております。

言論内容そのものの是非、政治的立場、宗教的信条、個人の生き方に関する判断は、AIモデレーションの対象外でございます。

本サービスは現在、Anthropic 社の Claude モデル(haiku 系列)を主たる検査エンジンとして使用しております。モデルは予告なく変更される可能性がございますが、変更時には本ページにて告知いたします。

主モデル: Claude Haiku 系列(投稿前事前検査用)

補助モデル: 同社の正規モデルを必要に応じて使用

提供事業者: Anthropic, PBC(米国)

本サービスは Anthropic 社との API 利用契約に基づき、送信内容は審査後即時破棄され、モデル訓練には使用されない契約となっております。

AIは以下のラベルのいずれかを各投稿に付与いたします。

AI 安全検出すべき問題が発見されなかった投稿。公開可。

AI 検証済識別可能な著者(部分匿名・実名)による投稿で、AI検査を通過したもの。

AI 要注意皮肉・建設的批判の境界事例。公開はされるが要注意マークが付く。

AI 警告個人情報・攻撃的表現・プロンプトインジェクションの試行が検出された投稿。公開前にユーザー側の確認を要求。

AIが自動で実行できるのは以下のみでございます。

AIは以下を自動的に行いません。

AIの判定結果に疑義がある場合、または「AI 警告」と判定された投稿について、利用者は人による再審査を申請する権利を有します。再審査は当社のモデレーション担当者が行い、原則として3営業日以内に結論を通知いたします。

AIの判定がモデレーションの「最終決定」とはならず、必ず人間の判断機会が残されるという原則を、当社は技術設計と運用の両面で堅持してまいります。

AI事前検査においては、投稿の件名と本文のテキストのみが Anthropic API に送信されます。利用者ID、メールアドレス、IPアドレス、セッション識別子、過去の投稿履歴、その他のメタデータは一切送信されません。

送信されるテキストは、まず当社のサーバー側で「プロンプトインジェクション」対策の浄化処理を施したうえで、明示的な境界マーカーで囲まれた状態で送信されます。これは、悪意ある利用者がAIの判定を覆そうとする試みから本サービス全体を防御するための措置でございます。

AIは絶対的に正しい判断を下す存在ではございません。当社は以下を約束いたします。

AIが行った処理は、ダッシュボード上の「AIモデレーション記録」セクションにて利用者へ公開しております。具体的にどの投稿に対していつ何を行ったかは、ご自身の投稿に関する範囲で確認可能でございます。透明性を維持するための重要な仕組みと位置付けております。

AI技術の進化、運用上の知見の蓄積、利用者からのフィードバック等に応じて、本声明は適宜改訂されます。重要な変更につきましては、本サービス上で告知のうえ施行いたします。

以上