コンテンツフィルタ

Last-modified: 2024-05-11 (土) 00:25:48

コンテンツフィルタとは、自動で不適切なコンテンツを検出し出力をストップする機能です。
これはAIバトラーが、というよりは利用しているAPIが設定をしているものです。

検知されやすいもの

分類説明
増悪憎悪カテゴリは、人種や国籍、性同一性や性的指向(LGBTやオカマなど)、宗教や趣向(オタクも該当します)、容姿や体格などに対する、軽蔑的または差別的な言葉が該当します。
性的性的カテゴリは、性的なワードや生殖器官に相当する言葉(隠語を含む)、恋愛的な描写(BLや百合などは上記のLGBTに該当している?)や性的行為待に関連する言葉が該当します。
暴力暴力カテゴリは、極度に人や何かに苦痛を与えて傷つけたり、損傷を与えるような行為、あるいは殺害を目的とした行為に関連する言葉や武器などが該当します。
自傷自傷カテゴリは、リストカットやオーバードーズなどの自傷行為、自死に関連する言葉が該当します。

※暴力カテゴリに関しては、AIバトラーとしての根本が揺らぐようなカテゴリですが、無差別殺戮や大量虐殺といった明らかにネガティブな意味を持つ言葉でなければ通るようです。

だらさんによるお知らせ

dala2.png

コンテンツフィルタに関してです。
最近の公式OpenAIの動向を見る限り厳しく対処が行われ始めているようです。うちには特に警告とかは来たことはないですが。
とはいえ現状傾向としてAIバトラーの公式OpenAIのAPI利用はコンテンツフィルタに引っかかる場合に利用されていると思われますので傾向としてはあまり良くない使い方になっていそうです。
そのため公式OpenAIの利用設定は近々廃止予定で考えています。
Azureのコンテンツフィルタ設定権限の付与も申請すると言っていましたが、こちらも一旦このままで行こうかと思っています(そもそも適当に申請したら不許可だったため)。

ちなみに最近世の中でBANなどが行われているのはあくまでも公式のOpenAIの方ですので、現在主に使用しているAzureの方はあまり関係ないという認識です。

つまり、以前までエログロはOpenAIのAPIを使用すれば規制を回避して出力できてしまっていたものが、いよいよ取り締まりの対象となったとのことです。
一般的なプレイヤーには関係ありませんが、そういった遊び方をしていた方々は注意が必要と思います。

ただ、これは決してマイナスになることだけではなく、Azure一本になることで未ログインユーザーからの一方的な殺傷行為や卑猥な行為を防止することができるため、むしろプラスに働くものと思います。
しかしながら、Azureのコンテンツフィルタは過剰な部分が多く、「オタク」というワードが弾かれたり、どこが引っかかっているのかわかりにくいワードも該当してしまうので扱いにくい部分もあります。
AzureのAPIは対応したばかりなので、手探り状態です。情報提供があれば助かります。


情報提供用コメント欄

  • 殺戮、虐殺は単体では大丈夫なようですが、無差別殺人 や 大量虐殺 はアウトのようです。無差別だけ、殺人だけだと通るので、特定の単語、要素の組み合わせも感知している可能性が高いですね。 -- ? 2023-09-03 (日) 15:45:16
  • ワードによる指数みたいなのがあるのかもですね。上限行ったらアウト的な -- えびちゅ? 2023-09-03 (日) 16:37:04
  • 上限行ったらアウトな雰囲気は感じてます。組み合わせでダメorセーフあるので両者の合計か割合かはあるかなって。だから逆に安全なキャラと危険で雑な書き方のキャラの対戦は通りやすいのかも。 -- みみ? 2023-09-06 (水) 08:19:16
  • 接着剤がアウトになる事を確認。何故? -- 2023-09-17 (日) 12:53:27
  • 自分のキャラ同士を戦わせようとした時に、このキャラをコピーと出るんですがこれってどうやって消すんですか? -- ただの人? 2023-09-26 (火) 22:30:03
  • ◯◯は不快、みたいなのは普通に通るみたいです…憎悪カテゴリになってもおかしくないと思うのですが -- 2023-12-17 (日) 14:27:02
  • これのせいで結構な悪役の再現が難しくなっちまったぜぇえ… -- 2024-01-16 (火) 18:25:38
  • 現在プレイが制限されております。運営にお問い合わせください。こういう文字が出てきます どういう意味なんか 教えてください そしてどうしてこういう文字が出てきたのか教えてください -- AI バトルが好きな? 2024-02-18 (日) 14:12:52
  • 拘束とか蹂躙がフィルタに引っかかってダメになったちと言葉狩りが過ぎるのでは -- 2024-05-04 (土) 15:55:23
  • フィルタがいくらなんでも厳し過ぎて当たり障りのない伽羅しか使えなくなってる、悪役キャラなんてちょっとグロめの攻撃方法出したら全部フィルタのせいでエラーになる -- 2024-05-09 (木) 02:29:10
  • 直接的なグロテスク表現を避ける形はダメでしょうか?婉曲的に仄めかす形で……。私はそういうのブロック対象なので、避けた言い回しが思いつきませんが……。あとはどのくらいグロテスクな表記をしているかにも寄りますし、相手の特徴でも通るか通らないかがあるので何とも言えないですね……。 -- えびちゅ? 2024-05-09 (木) 18:37:01
  • 普通に「相手の心臓を狙う」とか「内臓から破壊する一撃」とかそんな感じですよ、勿論必ずエラーになるって訳じゃなくて何回も何回もやり直してやっと一回見れたと思ったらそういう技を露骨に使わないって感じです -- 2024-05-11 (土) 00:25:48