コピペチェックとは?一致率の目安や下げるための対策を詳しく紹介

他者が作成したコンテンツをコピペしたり、故意ではなくてもコピペに近くなってしまったりしたコンテンツを公開すると、著作権侵害やGoogleからペナルティを受ける恐れがあります。しかし、そもそもコピペチェックとはどのように行うのか、チェックツールでの一致率の目安はあるのかなどがわからない方もいるでしょう。
そこで、この記事ではコピペチェックとは何かから、一致率の目安や必要な理由をご紹介します。また、チェックに引っかかってしまう理由と対策方法もお伝えしますので、ぜひご参考にしてください。
執筆者

マーケティングサポート「バンソウ」のメディア管理人
株式会社クリエイティブバンクのマーケティングサポート「バンソウ」のメディア管理人。得意分野は、SEO全般・サイト分析・オウンドメディア・コンテンツマーケティング。バンソウはクライアント様のBtoBマーケティングをサポートするサービスです。詳しい内容はこちらをご覧ください。
コピペチェックとは
コピペチェックとは、Webに公開した文章や表などのコンテンツが、他者のコンテンツをコピー&ペーストしたものでないかをチェックすることです。
コピペは、Webライティングの際に競合サイトのコンテンツをコピペしてしまう故意的なものと、SEO対策を意識した結果コンテンツが偶然似てしまったなどの非故意的なものに分けられます。
このように、コピペや複製が発生することを防ぐためには、コピペチェックを行うことが大切です。
次にコピペチェックにおける一致率の目安についてご紹介します。
コピペチェックにおける一致率の目安とは
コピペチェックの一致率には理想とNGの目安があり、理想の目安は「30%」以下、NGとされる目安は「50%」以上となっています。
Webライティングは、コピペにならないようライター自身の表現でコンテンツを作成するのが大切ですが、文章においてはやむを得ず似てしてしまうこともあるため、30%以下程度が理想の目安とされています。
また、コンテンツのテーマによっては、一致率が高くなることもあります。例えば、作業の手順を説明する際にほかのサイトと説明する内容が似てしまうことや、法律に関するコンテンツで法的根拠を示すために複数の法律を引用することなどがあげられます。
このように、文章に独自性を出すのが難しいテーマは一致率が高くなるため、この場合は50%を超えないように意識したり、テーマを見越して高い一致率で設定したりすることが大切です。
さらに、クライアントにコンテンツを納品する際、条件として一致率が「30〜49%」と設定されていることが多く、ほかにもひとつの文字列で10文字以上は一致してはならないといった条件が設定されることもあるため、コピペチェックの条件はしっかりと確認しておきましょう。
ここまでで、コピペチェックの一致率をお伝えしました。次に、コピペチェックを行う方法をご紹介します。
コピペチェックの方法
コピペチェックの方法には、ツールと目視の2つの方法があります。ここでは、それぞれの方法についてご紹介します。
ツール
コピペチェックには、さまざまな有料・無料ツールがあります。
これらのツールがコピペチェックを行う仕組みとしては、まずツールに入力されたコンテンツをデータベースに保存し、単語や文章単位で分割します。次に、ツール内のクローラーがWebから分割した単語や文章が一致しているサイトを見つけて、どのくらい一致しているかを一致率として表示するといった仕組みになっています。
各ツールのアルゴリズムは異なりますが、この一致率が高かったり、長い文章での一致が見られたりするとコピーコンテンツである可能性は高いといえるでしょう。
また、画像のコピペチェックをする際は、Googleの画像検索機能を使うことでコピペや類似画像を見つけられますので、活用するのがおすすめです。
目視
目視では、引用のルールがしっかりと守られているか、完全一致ではなくても文章が似すぎていないかなどをチェックします。引用の際は引用元を明記するなどのルールがあり、これを遵守していないと引用元やGoogleのクローラーにコピペしたコンテンツであると判断される恐れがあります。
また、コピペチェックツールでは一致率が低かったとしても、読んでみると文章が競合サイトと似すぎている可能性もあるため、目視でのチェックも非常に重要です。
ここまでで、コピペチェックの方法についてお伝えしました。しかし、なぜコピペチェックが必要なのかわからない方もいるでしょう。そこで、次ではコピペチェックが必要な理由をご紹介します。
コピペチェックが必要な理由
コピペチェックは、コピペのコンテンツを公開してしまうリスクやGoogleからペナルティを受けるリスクを避けるために重要です。ここでは、必要な理由をそれぞれご紹介します。
外注先からの納品記事がコピペでないかを確認するため
Webライティングを外注している場合、納品された記事がコピペではないかをチェックしないまま公開してしまうと、それが他者サイトのコピペだった際に掲載している自社サイトの信用が損なわれてしまいます。
外注先によっては、Webライティングの業務負担を減らすためにコピペで納品している業者がいる可能性があるため、不正を行っていないかをコピペチェックで見つけることが大切です。
Googleからペナルティ判定されるのを防ぐため
他サイトからコピペしたコンテンツは、Googleでペナルティの対象となります。Googleでは、著作権の侵害や検索品質の低下を防ぐために、以下のようなサイトに対してペナルティを設けています。
- 他のサイトのコンテンツをコピーし、元のソースを引用することさえせず、独自のコンテンツや価値を加えずに転載しているサイト
- 他のサイトのコンテンツをコピーし、(語句を類義語に置き換えたり自動化された手法を使用したりして)若干の修正を加えたうえで転載しているサイト
- ユーザーに対してなんらかの形で独自のメリットを提供することなく、他のサイトからのコンテンツ フィードをそのまま掲載しているサイト
- ユーザーに実質的な付加価値を提供することなく、他のサイトの動画、画像、その他のメディアなどのコンテンツを埋め込んだり編集したりしているだけのサイト
引用:Google ウェブ検索のスパムに関するポリシー|無断複製されたコンテンツ|Google 検索セントラル
ペナルティを受けると、検索順位の大幅な低下や検索結果への非表示といった現象が見られ、復旧にも非常に労力や時間が必要になりますので、他サイトをコピペしてコンテンツを作成するのは避けましょう。
著作権を侵害するリスクを避けるため
コピペチェックを行うと、著作権侵害のリスクも避けられます。他者が作成したコンテンツをコピペして使用するという行為は著作権の侵害に該当するため、権利者が告訴すると以下の処罰を受ける可能性があります。
著作権、出版権、著作隣接権の侵害は、10年以下の懲役又は1000万円以下の罰金、著作者人格権、実演家人格権の侵害などは、5年以下の懲役又は500万円以下の罰金などが定められています。
引用:著作物を無断で使うと?|民事上の請求、刑事上の罰則|公益社団法人著作権情報センター
もし告訴されなかったとしても会社やサイトなどの信用がなくなってしまい、取引や売り上げにも少なからず影響が出ると考えられます。そのため、コピペチェックを行って著作権の侵害を未然に防ぎましょう。
SEOで低品質評価を受けないようにするため
コピペのコンテンツは検索上位に表示されにくくなります。Googleは常に高品質なコンテンツを上位に表示させるためにアルゴリズムを見直しており、ニーズに合っているものの中で独自性や専門性の高いコンテンツをより評価します。
そのため、コピペのコンテンツは競合サイトよりも優れている点がなく、独自性もないためSEOにおいては低品質なコンテンツと判断され、上位には表示されなくなるでしょう。意図せずコピペ同様のコンテンツになって検索エンジンから低評価を受けてしまう前に、しっかりとコピペチェックで一致率を見ておくことが大切です。
偶然コピペのような内容になっていないかを確認するため
先述したように、コピペにはコンテンツが偶然似てしまうといった非故意的なものも存在します。しかし、故意ではないとはいえ、ユーザーにコピペだと思われてしまうとサイトにマイナスな印象を与えてしまいます。
また、クライアントにコンテンツを納品する際にコピペが発覚すると信頼を失ったり、契約を解除されたりする恐れもあります。
そのため、コンテンツの公開前や納品前にコピペチェックを行う習慣や体制を設け、コピペチェックを行うことが重要です。これにより、コピペの防止につながり、ユーザーやクライアントの信頼を失うリスクを避けられるでしょう。
故意でなくてもコピペチェックに引っかかってしまう場合、次でご紹介する理由が当てはまっている可能性がありますので、その理由を把握しておくことが大切です。
故意でなくてもコピペチェックに引っかかってしまう理由
故意でコピペしていない場合にも、ここであげる理由に該当するとコピペチェックに引っかかってしまうことがあります。チェックに引っかかっている場合や事前に対策する場合は以下の理由を確認しましょう。
文節を入れ替えただけのような文章になっているため
文節を入れ替えただけのような文章は、コピペチェックに引っかかりやすくなります。
例えば、以下のような文章が該当します。
- パラフレーズとは、他者の文章をそのまま使う転載や出典とは異なり、表現方法を変えて記載することです。
- パラフレーズとは、表現方法を変えて記載することで、他者の文章をそのまま使う転載や出典とは異なります。
この2つの文章は同じ言葉を使いつつ入れ替えているだけなので、一致率は非常に高くなります。
また、以下のように短くするだけでもコピペと判断されやすいです。
- パラフレーズとは、転載や出典とは異なり表現方法を変えて記載することです。
コピペチェックでは、単語や文節を区切ってチェックを行うため、一致率を下げるには単語や表現方法を変える必要があるでしょう。
十分な知識や情報収集ができていないため
作成するコンテンツのテーマに十分な知識がなかったり、情報収集ができていなかったりするとチェックに引っかかりやすくなります。
例えば、デスクトップPCの内部に設置されている各パーツについて解説するコンテンツを作る場合、その分野に詳しくないと参考にした文章だけの知見になるため、自分の表現方法で文章を書きづらくなり、似たような文章ができてしまいます。
コピペチェックに引っかからないようにするには、作成するテーマの知識を十分に増やして自分の表現で作成することが大切です。
内容が整理しきれていないため
内容が整理しきれていない状態で文章を作成すると、参考にした文章の一部をそのまま使ってしまいがちです。また、文章構成も似てしまうと全体的に同じような文章になり、チェックに引っかかりやすくなります。
そのため、参考文章を一度かみ砕いて、何を伝えたいのかを整理してから書くのがおすすめです。そうすることで、自分の言葉で文章を書きやすくなるでしょう。
チェック後の履歴が残っているため
コピペチェックで、参考にした文章との一致率が高いと表示されたコンテンツをリライトした際に、リライトする前のものもチェック対象に入っていると、リライト前後のコンテンツを比較することになり、一致率が非常に高く表示される場合があります。
特に、チェック履歴が残る「CopyContentDetector」などで起こりやすいため、同じ文章をチェックするときは履歴を消してから行いましょう。
ここまででお伝えした理由によってコピペチェックに引っかかってしまう場合は、一致率を下げる必要があります。次では、コピペチェックの一致率を下げるための対策についてご紹介します。
コピペチェックの一致率を下げるための対策
コピペチェックの一致率を下げるには、独自性のある情報を取り入れたり、同義語に置き換えたりするといった対策があります。ここでは、一致率を下げるためのさまざまな対策をご紹介しますので、ぜひ実践してみてください。
独自性のある情報を取り入れる
先述したSEO対策の面だけでなく、コピペチェックの対策としても独自性のあるコンテンツは効果的です。特に、経験談などの他者にはない情報を取り入れることで一致率を下げられるでしょう。
経験談はSEOにも効果的で、Googleが公表しているGoogleの品質評価ガイドラインにおいて、「ユーザー価値の高い良質コンテンツ」を判断するための指標に「E-E-A-T」があります。
これは「経験(Experience)」「専門性(Expertise)」「権威性(Authoritativeness)」「信頼性(Trustworthiness)」の4要素があり、経験が含まれているため、経験談や感想などの情報を取り入れることは重要です。
箇条書きや図表を使って説明する
手順の説明は、単語の言い換えなどの工夫をするのが難しいため、箇条書きや図表などを使って説明するのがおすすめです。参考サイトが箇条書きを使っていない場合は、自身の説明に箇条書きや図表を使うことで、一致率も下げられるだけでなく、ユーザーにもわかりやすいコンテンツになります。
単語や文章を削除する
一致率が高い場合は単語や文章を削除してみるとよいでしょう。特にコンテンツSEOでは、キーワードを意識して執筆するため一致率が高くなりがちです。
そこで、一致率が高い単語や文章は削除したり、使うのを避けられるように文章を変更したりすることで一致率を下げられます。全体に大きく影響が出ないのであれば、一致率が高い小見出しを1つ分削除するといった方法も有効です。
同義語に置き換える
単語を別の同義語に置き換えることは一致率の減少に効果的です。ツールを使用した際にコピペと判断された単語がある場合は、同義語や類義語を調べて置き換えるとよいでしょう。
また、短い文章がコピペと判断された場合は、その文章の言い換えも調べてみることで、別の言葉での表現方法が見つかる可能性があります。
漢字をひらく・とじる
漢字のひらく・とじるを活用するのもコピペチェックに効果的です。
漢字をひらくとは、漢字をひらがなで表記することで、漢字をとじるとは、ひらがなを漢字で表記することです。例としては「更に」⇔「さらに」や「する上で」⇔「するうえで」、「様々な」⇔「さまざまな」といった表記があげられます。
一致率が高いときは、漢字のひらく・とじるを使うことで一致率の低下を図るのもおすすめです。
記号を使う
記号をうまく使うことで、表現の幅が広がるためコピペチェックにも引っかからなくなります。例えば、手順の説明をする際の名称に「」、強調する部分には【】を使うなどの工夫を施すことで、コピペを避けられるでしょう。
こそあど言葉を使いすぎない
「これ・どれ・あれ・どれ」といった「こそあど言葉」や接続詞も同じものを使うと一致率が上がることがあります。使いすぎるとユーザーにわかりにくい文章になる恐れがありますので、使わなくても文章の意味が伝わる場合は書かないようにするなどの対策を行うとよいでしょう。
コピペ以外にも転載や引用などの似た意味を持つ言葉があります。その違いを理解することで、他者の作成物をコピペではなく正式にコンテンツに使用できる可能性がありますので、次にご紹介します。
コピペと転載・引用・パラフレーズの違い
コピペとは、自分の作成物または他者の作成物を、許可を取らずにコピーして貼り付けることですが、似た意味を持つ言葉として転載・引用・パラフレーズがあげられます。ここでは、それぞれの意味をご紹介しますので、それらの違いを理解しましょう。
転載
転載とは、他者が作成したものを著作者に許可を得たうえで、出典を明記して自分のコンテンツに載せることです。文章中の主従関係では、自分の文章より他者の文章の割合が多くなる場合にこの方法で記載します。
転載のルールは以下のとおりです。
- 著作者に転載の許可を取る
- 転載する文章は改変してはいけない
- 転載する文章と自分の文章を明確に区別する
- 出典元を明記する
転載する際は、“”(ダブルクォーテーション)または「」(かぎ括弧)で囲む、転載部分の背景色を変える、斜体で表記するといったかたちで自分の文章と明確に区別します。
転載の許可を得る際には、出典元企業のルールをよく確認し、転載許諾依頼メールを送ったり、出典元で用意された申請用フォーマットを使用したりして申請を行いましょう。
引用
著作権法第32条では引用について以下のように記載されています。
公表された著作物は、引用して利用することができる。この場合において、その引用は、公正な慣行に合致するものであり、かつ、報道、批評、研究その他の引用の目的上正当な範囲内で行なわれるものでなければならない。
つまり、公正な慣行に合致するものであれば無断でも他者のコンテンツを使用できます。文章中の主従関係では、自分の文章より他者の文章の割合が少ない場合にこの方法で記載します。
引用のルールは以下のとおりです。
- 引用する文章は改変してはいけない
- 引用する文章と自分の文章を明確に区別する
- 引用元を明記する
文章中の主従関係は客観的に判断されるため、この関係を主観で見誤って転載の方法で他者コンテンツを使用しなければならないのに、引用の方法で記載してしまったなどでトラブルが起きないように主従関係を確認することが大切です。
パラフレーズ
パラフレーズとは、他者の文章をそのまま使う転載や出典とは異なり、表現方法を変えて記載することです。
例えば、参照元の文章内で専門的な言葉が多い場合、それを誰でもわかるように伝えるために、一般的な言葉を使った表現方法で記載するなどがあげられます。
パラフレーズのルールは以下のとおりです。
- 参照する文章の内容や趣旨は変えてはいけない
- 参照元を明記する
ネット上には、パラフレーズを行ってくれるツールもありますが、文章中の単語が変わるだけのこともあるため、要約やわかりやすく言い換えるときは、自分の言葉で説明することをおすすめします。
まとめ
この記事では、コピペチェックの方法や一致率の目安などについてご紹介しました。チェック方法にはツールと目視の2種類があり、コピペの発見や引用ルールの確認などを行います。コピペチェックの一致率には理想とNGの目安があり、理想は「30%」以下、NGは「50%」以上となっています。この目安の範囲に収めるためには、独自性のある情報を取り入れたり、単語を同義語に置き換えたりするなどの対策を行うとよいでしょう。