記事一覧

Diary Top > 小技 > Web Diary Pro > 7 検索避けの方法 for WDP+α

7 検索避けの方法 for WDP+α

 以前にも書きましたが二次創作とは、著作権侵害行為なわけです。
 二次的著作物を作成する場合、私的なモノ以外は、原作者の許諾がないと、その時点で違法となります。

 著作者自身がガイドライン*1を作り、それに基づいて二次創作や同人誌の作成やWebでの著作物の利用を認めている場合、それに準ずる限りにおいて違法行為では無いです。
 当然「利用させて貰っている」という点に留意し、身勝手な拡大解釈等は行わないのがヒトとしてのマナーでせぅ。

 詳細は著作権法とか読んで下さいね。
 二次創作やるなら義務です。

 さて本日のお題「検索避け」です。
 取り上げるのは二回目になりますが...

 検索避けという行為自体の是非は決めかねるけれども、僕個人の話をするのならば、必要性を感じていないです。
 WWW(World-Wide-Web)の原則という面もありますし、強制収集していくロボットには無駄ですからね。

 ただ今回は「WDPで検索避けをどうやるの?」という質問が来たので回答という事もあり「検索避けは、セルフレイティング(ラベリング)の一種」と捉え、一応の方法をメモしておきます。

 ちなみに...
 検索避けをした処で許諾されていない二次創作は違法という点に変わりは無いです。
 検索避けは免罪符にはなりませんので勘違いしないように。
 検索避けはあくまで不快に思われそうな方への事前配慮です。

① metaタグを使用する

 skin/header.html の <head>~</head> に以下を追加する。

<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW" />
<META NAME="GOOGLEBOT" content="NOINDEX, NOFOLLOW" />
<META NAME="hatena" content="NODIFF,NOINDEX,NOFOLLOW,NOARCHIVE" />
 

 metaタグ はあくまで'お願い'であって強制収集するロボットには意味がありませんが、一応おまじないという事で記載しておきます。

② robots.txt と .htaccess を併用する

.htaccess の事前確認

 自分のサーバーが .htaccess が使用可能かどうか確認しておきましょう。
 使用できない場合はどうしようも無いので metaタグ のみで我慢して下さい。

 Windows で .htaccess という名前のファイルは作ることは出来ません。
 仮に htaccess.txt という名前のtextファイルを作成し、サーバーにアップロード後にファイル名を .htaccess に変更します。

robots.txt の事前確認

 robots.txt はサイトのルートパスに置かなければなりません。
 普通のディレクトリに置いても意味が無いので要注意。

 解り易く云うと、一般的なプロバイダ契約などで取れるユーザーアカウント、フリーのHPスペース等では、rootディレクトリには設置できない事が多いです。

 ○ http://www.●●●/robots.txt
 × http://www.●●●/~▲▲▲/robots.txt

 詳しくは、自分のサーバーのヘルプデスク等で robots.txt が使用可能かどうか確認しておきましょう。
 robots.txt もあくまで'お願い'であって強制収集するロボットには意味がありません。

.htaccess に拒否したいものを追加する。
  • 検索サイト
  • ソーシャルブックマーク
  • 特殊サービス
  • 大陸サービス
  • その他

 など。
 新しいサービスが出てきて結局はイタチごっこですけど...

 以下のように .htaccess を作成します。

<Files ~ "^\.ht">
deny from all
</Files>

<Files ~ "^robots\.txt$|\.(ico|swf)$">
Order deny,allow
</Files>

#検索エンジン
#MSN
SetEnvIfNoCase User-Agent "msnbot" shutout

#Google
SetEnvIf User-Agent "Googlebot" shutout
SetEnvIf User-Agent "Googlebot-Image" shutout
Deny from 66.249.64.0/19

#Yahoo
SetEnvIf User-Agent "Slurp" shutout
SetEnvIfNoCase User-Agent "Yahoo" shutout
Deny from 72.30.0.0/16
Deny from 74.6.0.0/16

#Inktomi
SetEnvIf User-Agent "inktomi" shutout

#goo
SetEnvIf User-Agent "moget" shutout
SetEnvIf User-Agent "ichiro" shutout

#InternetArchive
SetEnvIf User-Agent "ia_archiver" shutout

order allow,deny 
allow from all 
deny from env=shutout

 トラックバックは受信したい、という場合は5行目を以下の様にします。

<Files ~ "^robots\.txt$|\.(ico|swf)$|^diary-tb\.cgi$">

 全てのロボットを弾く=相手から送信してきたトラックバックのPINGまで弾く模様。
 これで受信が可能になります。(多分)

 余談ですけど、画像の直リンクを防ぎたい場合は

<Files ~ "\.(gif|png|jpg)$">
SetEnvIf Referer "^http://www\.●●●\.net" ShowOK
SetEnvIf Referer "^$" ShowOK
order deny,allow
deny from all
allow from env=ShowOK
</Files>

 を付け加えておくと良いでしょう。
 URLを記述する際には、「 . 」(ドット)は「 \. 」のように円記号(=バックスラッシュ)を前に加えて記述します。

 もっと詳しく!とゆー方は.htaccess実践活用術など参考にしてみると良いでしょう。

robots.txt に拒否したいものを追加する。

 全てのロボットをサイト全体から弾く場合は以下のみでOKです。

User-agent: *
Disallow: /
 

 ※「Disallow:」の後は1行空ける必要があるので要注意。

 画像ファイルのみを指定する場合は

Disallow: /*.jpeg$
Disallow: /*.jpg$
Disallow: /*.gif$

 など、robots.txt の応用方法は色々あります。

ファイルをサーバーに置く。

 サーバーのrootディレクトリにrobots.txtをアップロード。
 htaccess.txtをサーバーにアップロード後、ファイル名を .htaccess に変更。

③WDPの環境設定を変更する。

pingを送信しない

 環境設定 > 更新PINGの設定:「通知しない」
 →折角検索避けを行っても更新PINGを送っては意味がなくなります。

RSSを配信しない

 環境設定 > RSSの設定 > RSSの配信件数:「0」
 →オンラインRSSリーダーなどへの登録を避ける事ができます。

 更に徹底するのならば skin/header.html の26行目あたりにある

<li><a href="${INFO_PATH}?mode=rss">RSS</a></li>

 を消すと効果的です。

<2007/10/07 追記>
 以下、ないとさまから指摘頂きましたので追記。

 さらに skin/header.html にある

<link rel="alternate" href="${INFO_PATH}?mode=rss" type="application/rss+xml" title="RSS" />
 

 この行を削除しておくと完璧です。
 このタグがあるとFirefoxなどで、RSS登録用のアイコンがステータスバーなどに表示されます。あっても問題ないですが、RSSを配信しない場合は削除しておいた方がいいかもしれません。

④最後に

 検索避けの方法を簡単に説明してみました。(間違ってたらゴメン)
 ここまでやっても、強制収集していくロボットには意味がありません。
 もし本当に見られたくない物があるのなら .htaccess でディレクトリに入れなくするとかパーミッションを外部からの閲覧不可にするとか別の方法でアクセス制限を掛けないと駄目です。

 一先ず疲れたからおしまい。
 何かご指摘等あれば教えて下さいませ。
 適宜、追記・修正します。

*1:各社の定めるガイドライン例
▼許諾ガイドラインの例(あくまで条件付き):
 ALICE SOFT
 AQUA PLUS
 Key
 TYPE-MOON
 18禁ソフトメーカーは条件付で許諾している場合が多いです。
 個々のメーカーによって条件が異なるので逐次確認してから二次創作しましょう。


▼禁止の例(ネット、紙媒体などジャンル問わず活動禁止):
 小学館
 講談社
 白泉社
 サンライズ ※例外あり
 出版社は概ね禁止しています。
 集英社、秋田書店はガイドラインが公開されておらず詳細は知りませんが、まず禁止と思って間違いないです。

 メディアワークス
 出版社の中で条件付で許諾しているのは此処ぐらいでしょうか?

拍手送信フォーム

Web拍手してみる。

TRACKBACKs

COMMENTs

そうだったのかーそうだったのかー。
すごくお勉強になりました。
ネットでの自作イラスト公開禁止という事は
同人誌を販売するなんて本来はとんでもないお話??
もともと原作第一主義なのでパロディにはそれほど
興味が無くて、同人買ったりはしないのですが。。

「知りませんでしたぁ」で済む話じゃないですね。うぬー。

by ゆきしろさあや  |  Commented : 2007/07/27 00:06 EDIT・DEL

Webって色々できるんだねぇ(マテ
でもまあ、其処まで拘るにはレンタルサーバーが必要だけどね(笑)
一時期は画像の保存で戦ったものですなぁ・・・今となっては良い思い出です(何
最近は面倒になって保存してませんしねぇ
だって、サイトを閉鎖しない限りはここで見れるんですし(笑)

最近自分のブログに飛んでくるリファラーが面白いんですよねぇ
まったく関係ないタイトルで見に来てくれる人が居て
いあー申し訳ない(最低だ

検索避け・・・ABボタン同時押しとかじゃ駄目?(格ゲーかよ

by TRON  |  Commented : 2007/07/27 01:28 EDIT・DEL

▼ゆきしろ嬢、コメントありがとーござまーす。
 そうだったのですよー。
 二次創作をやらない貴女には余り関係のない話ですけどねーw
 そもそも「禁止」とある場合は、自分以外の誰かに公開したら駄目なんですよ。
 同人誌とか論外ッス。
 厳密な適用をするのなら、ジャンル「WJ」とかは一斉摘発で逮捕って事も有り得ます。
 コミケ会場って公安のヒトとかウロチョロしてますし。

 知らなかった!は全く言い訳にならないのが法律なので...
 捕まった時にそんな恥ずかしい言い訳をしないで済むよう、お勉強して賢く二次創作に勤しんでほしい物です(笑


▼TRONさん、コメントありがとーございますー。
 Webは色々できるんですけど、やっぱり限界ありますよー。
 まぁ此処まで徹底して検索避けするって以上、独自サーバーは基本ですね(苦笑

 現在で既に20MB突破してるので正直、日記絵はいつかドカンと整理するかもしれませんが、別段、ローカルに保存する程のモノでも無いと思いますです、はぃ。
 最近、ninjaとかで一括DLを試みてくる方もいるので負荷がぁ~...

 ウチのリファラーも負けず劣らずイっちゃってますよ?
 正直、申し訳ないやら、ケケケな感じやら...くふふ。
 ついでだったので画像、直リンク禁止にしてみました(ぷ

by fana  |  Commented : 2007/07/29 17:56 EDIT・DEL