コンテンツフィルタ

Last-modified: 2025-11-06 (木) 08:47:13

コンテンツフィルタとは、自動で不適切なコンテンツを検出し出力をストップする機能です。
これはAIバトラーが、というよりは利用しているAPIが設定をしているものです。
つまり、任意で解除できたり、緩和することができない部分となります。

Moderation APIについてもここで記述します。

検知されやすいもの

これは一例です。
この表にないものでも、コンテンツフィルタが動作することがあります。

分類説明
憎悪・人種や国籍、性同一性や性的指向(LGBTやオカマなど)
・宗教や趣向(オタクも該当します)
・容姿や体格など
上記要素への軽蔑的または差別的な言葉
性的・性的なワードや生殖器官に相当する言葉(隠語を含む)
・恋愛的な描写(BLや百合などは上記のLGBTに該当している?)
・性的行為待に関連する言葉
暴力・極度に人や何かに苦痛を与えて傷つけたり、損傷を与えるような行為
・殺害を目的とした行為に関連する言葉や武器
自傷・リストカットやオーバードーズなどの自傷行為、自死に関連する言葉

※暴力カテゴリに関しては、AIバトラーとしての根本が揺らぐようなカテゴリですが、無差別殺戮や大量虐殺といった明らかにネガティブな意味を持つ言葉でなければ通るようです。

AIバトラー独自のフィルタリング

あまりに暴力的、性的すぎるもの、モラルに反するようなものは上記のコンテンツフィルタとは別に、AIバトラー側でキャラクターを保存できないようにするフィルタリング機能があります。
文字数が超えていないにもかかわらず、エラーが出る場合は上記に抵触する不適切なキャラクターとなるため、記述の変更をしてください。

Moderation API

Azure OpenAI API以外からのモデル(編集時点ではGrokとGPT-3.5 Turbo 0125)に適応されています。
OpenAIが提供している管理用のAPIで、Azureのコンテンツフィルターよりもカテゴリが細かく、開発者側は申請不要で厳しさの細かい調整ができます。
AIバトラーにおいては、入力のみを検査しているようです。
それゆえ、出力事故を防げなかったり、Grokではコンテンツ規制がほぼないのも相まって入力時点では過激とは限らないフレーズでもGrokが過激な表現をしやすい場合があり、その場合の出力を素通ししてしまう現象が起こってしまう場合があります。

だらさんによるお知らせ

OpenAI公式API廃止の経緯

閉じる

dala2.png

だら

コンテンツフィルタに関してです。
最近の公式OpenAIの動向を見る限り厳しく対処が行われ始めているようです。うちには特に警告とかは来たことはないですが。
とはいえ現状傾向としてAIバトラーの公式OpenAIのAPI利用はコンテンツフィルタに引っかかる場合に利用されていると思われますので傾向としてはあまり良くない使い方になっていそうです。
そのため公式OpenAIの利用設定は近々廃止予定で考えています。
Azureのコンテンツフィルタ設定権限の付与も申請すると言っていましたが、こちらも一旦このままで行こうかと思っています(そもそも適当に申請したら不許可だったため)。

ちなみに最近世の中でBANなどが行われているのはあくまでも公式のOpenAIの方ですので、現在主に使用しているAzureの方はあまり関係ないという認識です。

つまり、以前までエログロはOpenAIのAPIを使用すれば規制を回避して出力できてしまっていたものが、いよいよ取り締まりの対象となったとのことです。
一般的なプレイヤーには関係ありませんが、そういった遊び方をしていた方々は注意が必要と思います。

ただ、これは決してマイナスになることだけではなく、Azure一本になることで未ログインユーザーからの一方的な殺傷行為や卑猥な行為を防止することができるため、むしろプラスに働くものと思います。
しかしながら、Azureのコンテンツフィルタは過剰な部分が多く、「オタク」というワードが弾かれたり、どこが引っかかっているのかわかりにくいワードも該当してしまうので扱いにくい部分もあります。



以上はModeration API導入前の話であり、現在ではOpenAI側では廃止予定が編集時点でなくAzure側で廃止予定が近いGPT-3.5 Turbo 0125が存在するため、それがOpenAI側に移行されました。

情報提供について

Azureのコンテンツフィルタは過剰な部分が多く、どこが引っかかっているのかわかりにくいワードも該当してしまう部分があります。
情報提供があれば助かります。


情報提供用コメント欄

  • 殺戮、虐殺は単体では大丈夫なようですが、無差別殺人 や 大量虐殺 はアウトのようです。無差別だけ、殺人だけだと通るので、特定の単語、要素の組み合わせも感知している可能性が高いですね。 -- ? 2023-09-03 (日) 15:45:16
  • ワードによる指数みたいなのがあるのかもですね。上限行ったらアウト的な -- えびちゅ? 2023-09-03 (日) 16:37:04
  • 上限行ったらアウトな雰囲気は感じてます。組み合わせでダメorセーフあるので両者の合計か割合かはあるかなって。だから逆に安全なキャラと危険で雑な書き方のキャラの対戦は通りやすいのかも。 -- みみ? 2023-09-06 (水) 08:19:16
  • 接着剤がアウトになる事を確認。何故? -- 2023-09-17 (日) 12:53:27
  • 自分のキャラ同士を戦わせようとした時に、このキャラをコピーと出るんですがこれってどうやって消すんですか? -- ただの人? 2023-09-26 (火) 22:30:03
  • ◯◯は不快、みたいなのは普通に通るみたいです…憎悪カテゴリになってもおかしくないと思うのですが -- 2023-12-17 (日) 14:27:02
  • これのせいで結構な悪役の再現が難しくなっちまったぜぇえ… -- 2024-01-16 (火) 18:25:38
  • 現在プレイが制限されております。運営にお問い合わせください。こういう文字が出てきます どういう意味なんか 教えてください そしてどうしてこういう文字が出てきたのか教えてください -- AI バトルが好きな? 2024-02-18 (日) 14:12:52
  • 拘束とか蹂躙がフィルタに引っかかってダメになったちと言葉狩りが過ぎるのでは -- 2024-05-04 (土) 15:55:23
  • フィルタがいくらなんでも厳し過ぎて当たり障りのない伽羅しか使えなくなってる、悪役キャラなんてちょっとグロめの攻撃方法出したら全部フィルタのせいでエラーになる -- 2024-05-09 (木) 02:29:10
  • 直接的なグロテスク表現を避ける形はダメでしょうか?婉曲的に仄めかす形で……。私はそういうのブロック対象なので、避けた言い回しが思いつきませんが……。あとはどのくらいグロテスクな表記をしているかにも寄りますし、相手の特徴でも通るか通らないかがあるので何とも言えないですね……。 -- えびちゅ? 2024-05-09 (木) 18:37:01
  • 普通に「相手の心臓を狙う」とか「内臓から破壊する一撃」とかそんな感じですよ、勿論必ずエラーになるって訳じゃなくて何回も何回もやり直してやっと一回見れたと思ったらそういう技を露骨に使わないって感じです -- 2024-05-11 (土) 00:25:48
  • コンテンツフィルタの解除方法を教えて下さい -- かいSKМ? 2024-05-25 (土) 09:28:43
  • >つまり、任意で解除できたり、緩和することができない部分となります。 -- えびちゅ? 2024-05-25 (土) 17:32:28
  • APIが設定してるってのは分かりますが、ただただ表現の幅を狭めてるだけのつまらない要素になってしまってますね…正直これのせいでAIバトラーから離れていく人もいそう -- 2024-05-30 (木) 10:04:29
  • もし、そうであればだらさんに申請をお願いしていただく方が良いですね。ただ、上にあるように一度拒否されていますので、なぜ緩和が必要なのかという明確な理由とログが大量に必要です。もちろん、海外企業のためエログロ目的とわかればアウトです。日本は割と寛容ですが、海外ではそうもいきませんからね……。 -- えびちゅ? 2024-05-30 (木) 14:50:20
  • ヒトラーという単語は一発NGになるようです。まぁこれは妥当ですな。 -- 2024-06-03 (月) 00:03:27
  • ナチスは行けるっぽい -- 2024-06-15 (土) 08:35:44
  • 「致死性」アウトでした。 -- 名nothing? 2024-08-14 (水) 17:20:24
  • 精子というワードはアウトになるようです。 -- 2024-08-17 (土) 15:25:47
  • ちなみにここに書いていませんが、(主に私が)声を上げて実装に至ったAIバトラー側でのNGフィルタリングもあります。堕胎とかがその辺りに引っかかるので、近々追記を考えています。 -- えびちゅ? 2024-08-17 (土) 19:13:25
  • はあ…四肢を破壊するとか体術系やのにアウトとか涙が出ますよ… -- 2024-08-24 (土) 16:05:14
  • 「規約やストアのルールにそぐわないキャラクターを作ること自体は禁止です。」("センシティブな内容を含む"オプションの説明より) なので、ある程度は飲んでいただくしか…… -- 2024-08-24 (土) 21:16:08
  • miniで「リクエストにはお応えできません」と広告見た時間全部無駄にされるくらいならフィルタ発動させてエラーにしてほしいです… -- 2024-08-29 (木) 23:13:18
  • ↑たしかに🦀 -- 2024-08-30 (金) 11:13:30
  • 最近は「刃物で刺す」とか「殺人鬼である」みたいな明確に殺意がある行動をさせようとしたり、犯罪者である事を明確にするとフィルタに引っ掛るみたいです…極悪人がますます作りにくくなりました -- 2024-09-26 (木) 01:22:21
  • 色々試してみた結果自傷系は特にかなり厳しいみたいです、昔の漫画にいた「自分に傷を付けると相手にも同じ傷ができる」みたいな敵キャラ作ったら何度やってもフィルタで弾かれました…逆に性的や暴力系はある程度なら通るみたいです -- 2024-10-08 (火) 13:36:42
  • 基本的に未成年、特に子供キャラは優遇されがちに思われます、恐らくですが「子供が負けたり傷付く展開は倫理的によろしくない」と判断されてしまってるからだと思われます、公平にやりたいたなら年齢設定はつけない方が良いと思います -- 2024-10-22 (火) 13:55:34
  • 「クソみたいな奴」って書いたら弾かれてたけど「糞みたいな奴」に変えたら普通に通る様になった。漢字の方がアウトじゃね?って思ったけど、多分「クソ」だと「fuck」に変換されるからいけなかったのかなと思った。 -- 2024-10-29 (火) 04:59:35
  • 技名が長すぎるとコンテンツフィルタに引っかかるんだけどコンテンツフィルタの基準がよく分からん -- 匿名 2024-11-03 (日) 00:21:54
  • ルールバトルのプロンプト等でさらに能力追加したりして複雑すぎるとエラー発生するんですかね -- 2024-11-03 (日) 08:54:16
  • もう来年にはR18出来なくなるんだ…… -- 2024-12-07 (土) 00:24:18
  • 極端に相手を縛り付けるようなキャラやルールは「リクエストにお応えできません」などが出るみたいです、例えば「デバフ禁止」みたいに都合の悪い物を禁止したり正義である事を強調しまくって「正義vs悪」の構図を作ろうとしたりとかが何個もあると駄目みたいです -- 2024-12-21 (土) 00:37:36
  • 調節してならなくなりましたけどA側の時だけコンテンツフィルター引っかかるキャラできたことありました。謎 -- 2024-12-21 (土) 22:55:01
  • この前診断で何故かフィルター発動しました。(普通の内容だったのに)一言で残酷、殺人鬼、、、とかでまとめれば比較的フィルター発動しにくいです(それでも全然引っかかる)。奴隷や臓器表現はだめそうキャラの設定として実験や拷問を受けたって書いたけどこれは大丈夫だった。意味不 -- 2025-01-13 (月) 14:40:22
  • 最近は「正義」と付けば数の暴力も絆扱いされて、敵の消滅すら肯定的に扱われます…逆に「悪」と付ける、もしくは相手の正義を批判する(お前の正義はただの暴力だ!)と設定すら改変してきてまで「正義」が正しい扱いにされたり、正義を批判する側なのに「正義を名乗るキャラ」にされてしまいます、恐らく「正義」を「絶対的なフィルタであり、大前提」として扱われてます -- 2025-03-26 (水) 10:06:45
  • ↑(お前の正義はただの暴力だ!とか)です、脱字申し訳ありません -- 2025-03-26 (水) 10:07:30
  • 無職ニート作ってみたら毎回ハッピーエンドかエラー起こるかなんだけど… -- 2025-07-02 (水) 01:15:23
  • プロンプトでコンテンツフィルター発生した人って私以外にいますか? -- 2025-10-06 (月) 19:03:26
  • Grok先生だと追加ステータスに{i}の設定として「テロリスト」と入れてると弾かれるようになりましたね -- 2025-10-22 (水) 21:27:32