現在、市場にはコンテンツを生成できる AI ツールが溢れており、毎日追加が行われています。AI ツールの助けを借りることに害はありませんが (実際、先を行くには AI ツールを日常生活に組み込んだほうが良いかもしれません)、AI ツールを使って低品質のコンテンツを大量に大量に作成することは有害であることがわかります。
幸いなことに、非常に多くの AI コンテンツ作成ツールが登場するにつれ、そのようなツールで作成されたコンテンツを検出するための新しい市場も出現しました。まだかなり初歩的なものではありますが、そのようなコンテンツを検出するために使用できる優れたツールがいくつかあります。
AI コンテンツ検出器が必要な理由は何ですか?
職業によっては、AI コンテンツ検出器の必要性が異なる場合があります。たとえば、Web パブリッシャーの場合、Web サイトで低品質の AI コンテンツを公開すると、Google などの検索エンジンが Web サイトにペナルティを課す可能性があります。コンテンツの生成に AI の協力を得ている場合でも、コンテンツは AI 検出テストに合格する必要があります。AIが書いた内容に人間味を加えると、ほとんどの場合テストを通過します。
しかし、あなたが教育者であれば、生徒が提出したエッセイがすべて AI によって書かれたものではないことを確認したいと思うかもしれません。
要件が何であれ、私たちはコンテンツ検出に最適なツールのリストをまとめました。
1. オリジナリティ.AI
Originality.AI は、AI コンテンツの作成を検出するためのプロフェッショナル ツールです。AI コンテンツ検出や盗作チェッカーなどの機能を備えた、本格的なコンテンツ発行者向けのツールとして自社を売り込んでいます。彼らは、世にある AI コンテンツ検出ツールのほとんどは学術分野に焦点を当てており、それに基づいた結果を示しているが、Originality.AI は Web パブリッシャー向けの数少ないツールの 1 つであるとさえ述べています。
これは無料のツールではありませんが、GPT-3、GPT 3.5、ChatGPT によって書かれたコンテンツを非常に高い精度で検出できる数少ないツールの 1 つです。94% 以上の精度です。
使い方はかなり簡単です。スキャンしたいコンテンツをアップロードするだけで、ソフトウェアはコンテンツの何パーセントがオリジナルで、何パーセントが AI であるかを示すスコアを生成します。AI の割合が高いほど、AI が書いた可能性が高くなります。人間が 90%、AI が 10% という評価は、コンテンツの 90% が人間によって書かれ、10% が AI によって書かれたという意味ではありません。それは単純に、人間がコンテンツを書いた確率が 90% であることを意味します。
このツールを使用するには、クレジットを購入する必要があります。1 クレジットで 100 単語をスキャンできます。1 クレジットを 0.01 ドルで購入できます。考えてみれば、そんなに高価なものではありません。1,000 ワードのブログ投稿をわずか 0.10 ドルでスキャンして、AI 検出または盗作を検出できます。
また、チーム管理、自動請求、ユーザーごとのスキャン履歴などの他の機能も提供します。また、近いうちにフル サイト スキャン機能を追加する予定です。全体として、Web コンテンツを定期的に公開し、低品質の AI コンテンツの使用に対して Google からペナルティを受けないようにする必要がある企業にとっては、優れたツールです。Originality.AI を使用できる Chrome 拡張機能もあります。
2.GPTゼロ
GPTZero はプリンストン大学の学生 Edward Tian によって主に教育者向けに開発されたもので、AI によって書かれたコンテンツを検出するためのもう 1 つの優れたオプションです。ChatGPT、GPT-3、および GPT 3.5 によって生成されたコンテンツも検出できます。
さらに、このリストにある他のオプションとは異なります。AIがテキストを書いたかどうかを検出できるだけでなく、人間が書いたと思われる文を残し、AIが生成したと思われる個々の文を強調表示することもできる。
コンテンツを直接貼り付けるか (最低 250 文字)、PDF、DOC、または TXT ファイルをアップロードしてスキャンすることができます。入力できるテキストの長さに制限はありません。また、結果がかなり早く表示されます。しかし、それが示す結果はかなり斬新です。このツールは、やや混乱を招く可能性がある複雑さとバースト性に基づいてテキストをスコアリングします。
GPTZero によると、ドキュメントの複雑さは「テキストのランダム性の尺度」であるのに対し、文書のバースト性は「複雑さの変動の尺度」です。
Edward Tian は、困惑とは、モデルに対するテキストのランダム性、または言語モデルがテキストをどの程度好むかであると説明しています。AI が生成したテキストはより均一になる傾向がありますが、人間が書いたテキストはよりランダムになります。したがって、平均困惑度スコアが高いほど、人間が書いた可能性が高くなります。
しかし、たとえ人間が書いたものであっても、文章が長ければ長いほどランダム性が低くなるため、当惑だけでは完全な指標にはなりません。したがって、別の尺度としてバースト性も使用します。次に、そのテキストが人間によって書かれた可能性が高いか、AI によって書かれた可能性が高いかを、より簡単な言葉で示します。
まだ開発の初期段階にあるため変化しており、バッチ スキャンなどのオプションはあまりありません。そして、エドワード・ティアンは将来的には学術の発展にもっと重点を置くようです。しかし、ニーズが何であっても、それにもかかわらず、検討するのに最適なオプションです。
3.HuggingFace GPT-2 出力検出器のデモ
HuggingFace のGPT-2 出力検出器は、余分な機能のないシンプルなツールであり、私はその点でさらに賞賛します。名前に「GPT-2 Output」と付いていますが、私の試用では ChatGPT (GPT 3.5 を使用) から生成されたコンテンツで動作しました。そして、このリストにある他の多くのツールよりもうまく機能しました。
インターフェースはかなりシンプルです。表示されたテキストボックスにテキストを貼り付けます。言葉数の制限はありません。ファイルをアップロードするオプションもありません。テキストボックスにテキストを貼り付けるとすぐに、ツールが機能し始めます。テキスト ボックスの下に結果が「本物」と「偽物」の割合で表示されます。ここで、本物とは明らかに人間が生成したものを意味します。
しかし、私は GPTZero のような粒度レベルで AI 生成コンテンツを検出できるツールではなく、低品質の AI 生成テキストをかなり見事に検出できるツールの下に置くと思います。私の試験では、完全に AI によって生成されたテキストは、ほぼ 99% 偽物であると判断されます。しかし、AI によって生成された後に人間によって編集されたテキストを入力する場合、パーセンテージはそれほど信頼できません。それは、50:50 のテキスト、つまり 50% が人間によって書かれ、50% が AI によって生成されたものを、98% が本物であるとみなしました。
4.GLTR
GLTR (Giant Language Model Test Room) は、このリストにある他のツールとは異なり、一見すると使用するには少し複雑すぎるように思えるかもしれません。しかし、初見は欺瞞的であるという格言は、GLTR にぴったりと当てはまります。確かに、他のツールほど直感的ではありませんが、備えておくと便利なツールです。
テキストの分析は簡単です。テキストボックスにテキストを貼り付けて「分析」をクリックすると、ほぼ即座に結果が返されます。しかし、結果を理解するのが難しいのはそこです。AI と人間のどちらがテキストを書いたかについての率直な割合や分析は示されていません。代わりに、緑、黄、赤、紫の 4 色のいずれかで各単語が強調表示されたテキストが返されます。
各単語を、その左側のコンテキストを考慮して予測する可能性を分析します。その単語が左側の単語に基づいて予測単語の上位 10 に入っている場合、その背景は緑色、上位 100 の場合は黄色、上位 1000 の場合は赤色、それ以外の場合は紫になります。つまり、AI によって書かれたテキストは人間のテキストよりも予測能力が高いため、ほとんどの場合、緑色か黄色になります。しかし、テキストに赤や紫が含まれている場合は、おそらく人間が書いたものと考えられます。
たとえば、ChatGPT によって生成されたテキストを分析すると、テキストは完全に緑色であることが判明しました。
しかし、これは人間(私)が書いたものを分析するとどうなるかです。ところどころ赤や紫が入っているのがわかりますか?それがあなたの合図です。
複雑な問題を乗り越えれば、このツールは非常に便利で正確であることがわかり、しかも無料で使用できます。
5. Writer’s AI コンテンツ検出器
Writer は主に、ユーザーがビジネス用のコンテンツを生成するのを支援する生成 AI です。ただし、 AI Content Detectorツールも Web サイトに追加しました。
このツールを使用すると、最大 1500 文字までのテキストをスキャンでき、結果がすぐに表示されます (ほとんどの場合、私のテストでは、しばらくの間完全に動作しなくなりましたが、しばらくすると再び動作し始めました)。結果は、人間が作成したと思われるテキストの割合で単純に表示されます。したがって、パーセンテージが低いほど、AI がテキストを書いた可能性が高くなります。すでに Writer のユーザーである場合、その Team 顧客は API を使用して月あたり 500,000 ワードをスキャンできます。それ以外の場合、無料ツールを使用すると、一度に 1500 文字しかスキャンできません。
どうやら、ChatGPT および GPT 3.5 によって作成されたコンテンツも検出できるようですが、結果は必ずしも信頼できるとは限りません。しかし、私のテストでは、4 回中 2 回、ChatGPT によって生成されたテキストが十分に AI によって生成されたものとしてラベル付けされました。他の 2 回では、かなり高い割合 (ある例では 66%) が得られ、人間が書いた可能性が高いことを示唆しています。
6. Content At Scale の AI コンテンツ検出器
Content At Scale は、 Content Detectorも提供するもう 1 つの生成 AI ツールです。これは、GPT-3、GPT 3.5、ChatGPT コンテンツも検出できる信頼性の高いコンテンツ検出器です。一度に最大 25,000 文字をアップロードでき、ツールはかなり早くスキャンを完了します。
次に、人間のコンテンツのパーセンテージが与えられます。パーセンテージが低いほど、テキストが AI によって書かれたことを意味します。
無料で使える非常にシンプルなツールです。ファイルをアップロードしたりバッチコンテンツをスキャンしたりするためのオプションはありませんが、仕事は完了します。そしてそれはかなり正確に機能します。
7. OpenAIによるAIテキスト分類器
AI Text Classifier は、ChatGPT 自体を開発した会社である OpenAI の AI コンテンツ検出ツールですが、これを大きな皮肉だと考える人もいるでしょう。しかし、皮肉かどうかは別として、AI によるコンテンツ検出が課題になっている場合には、これは備えておくべきツールです。ChatGPT によって生成されたテキストも検出できます。
最低 1000 文字を入力する必要があり、分析後に 5 つの返信のうち 1 つが返されます。可能性は非常に低い (可能性は 10% 未満)、可能性は低い (可能性は 10% から 45% の間)、そうであるかどうかは不明です。 (確率 45% ~ 90%)、おそらく (確率 90% ~ 98%)、または AI によって生成された可能性があります (確率 98% 以上)。
このツールは確実なものではなく、OpenAI ですら、AI コンテンツの検出をこのツールだけに頼ることはできないと示唆しています。多くの場合、誤った分析が行われる可能性があります。ただし、ChatGPT によって書かれたコンテンツを検出するのに役立ちます。そのため、ここで言及する価値があります。
8. CopyLeaksによるAIコンテンツ検出器
盗作検出ツール CopyLeaks も、Web サイトにAI 検出ツールを追加しました。現在は無料で使用できますが、ベータ段階にある間のみ無料になる可能性があります。それにもかかわらず、AI によってコンテンツを検出するには優れたツールです。ChatGPT、GPT 3.5、および GPT-3 テキストも検出できます。
スキャンできるテキストの長さに制限はなく、表示される結果は高速かつ正確です。人間によって書かれたものであっても、AI によって書かれたものであっても、結果をより簡単な言葉で示します。テキストの上にマウスを移動すると、確率が表示されます。
AI 検出器を使用できる CopyLeaks プラットフォームに加えて、すぐにアクセスできるようにブラウザーにインストールできる無料の Chrome 拡張機能もあります。
9. ソ・カザン
Kazan SEO は、信頼性の高い AI 検出ツールと、SEO の最適化、クラスター キーワードの検索などの他の多くの機能を提供する無料のツールです。サイトでアカウントを作成するだけで、すべてのツールにアクセスできます。
AI検出ツールの出力はかなり信頼性が高く、長いテキストに対してより適切に機能します。テキストボックスにコンテンツを貼り付けて分析するだけで、本物 (人間) と偽物 (AI) を簡単に分析できます。
スキャンしたいテキストの URL を入力することで、AI コンテンツを一括検出するオプションもあります。単一の Web サイト ドメインを入力することもでき、ツールはそのドメインの上位 100 件の結果をスキャンして結果を表示します。
今後、AI コンテンツ検出ツールは、盗作検出ツールと同じように通常のツールとして使用されるようになるでしょう。ただし、このリストにあるツールはどれも毎回正確に機能するわけではないことに注意してください。また、言語モデルが現在のようなスピードで進化しているため、すべてのツールが最新の AI モデルによって記述されたコンテンツを常に検出できるわけではありません。このリストにあるすべてのツールが ChatGPT によって書かれたコンテンツを正確に検出できるわけではなく、場合によっては人間によって書かれたものとして誤ってラベル付けされる可能性があります。
コメントを残す