如何使用robots.txt

什么是robots.txt?

robots.txt是一个纯文本文件,在这个文件中网站管理者可以声明该网站中不想被robots访问的部分,或者指定搜索引擎只收录指定的内容。

当一个搜索机器人(有的叫搜索蜘蛛)访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,那么搜索机器人就沿着链接抓取。

如果你想保护网站上的某些内容不被搜索引擎收入的话,robots.txt是一个简单有效的工具。这里简单介绍一下怎么使用它。

如何放置Robots.txt文件

robots.txt自身是一个文本文件。它必须位 于域名的根目录中并 被命名为"robots.txt"。位于子目录中的 robots.txt 文件无效,因为漫游器只在域名的根目录中查找此文件。例如,http://www.example.com/robots.txt 是有效位置,http://www.example.com/mysite/robots.txt 则不是。

这里举一个
robots.txt的例子:


User-agent: *

Disallow: /cgi-bin/

Disallow: /tmp/

Disallow: /~name/

使用 robots.txt 文件拦截或删除整个网站

要从搜索引擎中删除您的网站,并防止所有漫游器在以后抓取您的网站,请将以下 robots.txt 文件放入您服务器的根目录:


User-agent: *

Disallow: /

要只从 Google 中删除您的网站,并只是防止 Googlebot 将来抓取您的网站,请将以下 robots.txt 文件放入您服务器的根目录:


User-agent: Googlebot

Disallow: /

每 个端口都应有自己的 robots.txt 文件。尤其是您通过 http 和 https 托管内容的时候,这些协议都需要有各自的 robots.txt 文件。例如,要让 Googlebot 只为所有的 http 网页而不为 https 网页编制索引,应使用下面的 robots.txt 文件。

对于 http 协议 (http://yourserver.com/robots.txt):


User-agent: *

Allow: /

对于 https 协议 (https://yourserver.com/robots.txt):


User-agent: *

Disallow: /

允许所有的漫游器访问您的网页 User-agent: *
Disallow:
(另一种方法: 建立一个空的 "/robots.txt" 文件, 或者不使用robot.txt。)

禁止所有搜索引擎访问网站的任何部分

User-agent: *
Disallow: /

禁止所有搜索引擎访问网站的几个部分(下例中的01、02、03目录)

User-agent: *
Disallow: /01/
Disallow: /02/
Disallow: /03/

禁止某个搜索引擎的访问(下例中的BadBot)

User-agent: BadBot
Disallow: /

只允许某个搜索引擎的访问(下例中的Crawler)

User-agent: Crawler
Disallow:

User-agent: *
Disallow: /

使用 robots.txt 文件拦截或删除网页

您 可以使用 robots.txt 文件来阻止 Googlebot 抓取您网站上的网页。 例如,如果您正在手动创建 robots.txt 文件以阻止 Googlebot 抓取某一特定目录下(例如,private)的所有网页,可使用以下 robots.txt 条目:
User-agent: Googlebot
Disallow: /private
要阻止 Googlebot 抓取特定文件类型(例如,.gif)的所有文件,可使用以下 robots.txt 条目:User-agent: Googlebot
Disallow: /*.gif$
要阻止 Googlebot 抓取所有包含 ? 的网址(具体地说,这种网址以您的域名开头,后接任意字符串,然后是问号,而后又是任意字符串),可使用以下条目:User-agent: Googlebot
Disallow: /*?

Robots META标签的写法:

Robots META标签中没有大小写之分,name=”Robots”表示所有的搜索引擎,可以针对某个具体搜索引擎写为name=”BaiduSpider”。 content部分有四个指令选项:index、noindex、follow、nofollow,指令间以“,”分隔。

INDEX 指令告诉搜索机器人抓取该页面;

FOLLOW 指令表示搜索机器人可以沿着该页面上的链接继续抓取下去;

Robots Meta标签的缺省值是INDEX和FOLLOW,只有inktomi除外,对于它,缺省值是INDEX,NOFOLLOW。

这样,一共有四种组合:

<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">
<META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">
<META NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW">
<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">

其中

<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">可以写成<META NAME="ROBOTS" CONTENT="ALL">;

<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">可以写成<META NAME="ROBOTS" CONTENT="NONE">

目前看来,绝大多数的搜索引擎机器人都遵守robots.txt的规则,而对于Robots META标签,目前支持的并不多,但是正在逐渐增加,如著名搜索引擎GOOGLE就完全支持,而且GOOGLE还增加了一个指令“archive”,可以 限制GOOGLE是否保留网页快照。例如:

<META NAME="googlebot" CONTENT="index,follow,noarchive">

表示抓取该站点中页面并沿着页面中链接抓取,但是不在GOOLGE上保留该页面的网页快照。

vod_cache_data文件夹是什么?

你是不是在你的电脑里发现这个奇怪的隐藏文件夹,而且删除之后再开还有 ?

其实vod_cache_data是迅雷看看的数据缓存文件夹,这个版本的迅雷会自动选择用户机器剩余空间最大的分区进行保存,该文件夹从支持迅雷看看的第一 个版本就存在,只是放在操作系统的临时目录而已,大家没注意到,现在我们开放了设置,大家可以任意设置他的所在目录,如果你不使用迅雷看看,那么它里面不 会存在数据文件。

目前的解决方法也比较猥琐,只是眼不见为净罢了将以下文本复制到 新建 文本文档 中,并更改扩展名为.reg,双击导入注册表复制内容到剪贴板。以上红色部分可更换为你自己的任意目录,注意使用'\\'而不是'\',这样vod_cache_data文件夹就在你指定的目录中生成了

用迅雷看看来看电影的话,还是会生成的,只是换了地方而已。

代码:


以上目录可更换为你自己的任意目录,注意使用'\\'而不是'\',这样vod_cache_data文件夹就在你指定的目录中生成了。

当让,如果你使用的防毒软体有阻止进程访问文件的功能就可以完全阻止它的生成了,比如McAfee,新建一条规则阻止Thunder.exe创建D:\*vod_cache_data*\**,就可以防止再次在D盘生成vod_cache_data了 。

动画《白蛇传》-美国梦工厂

如果最近您还在为《功夫熊猫》争论、自嘲、反省,请看看另一个消息:有报载,中国四大爱情传说之一的“白蛇传”,将被《功夫熊猫》的制作方美国梦工 厂“拿走”,成为继《花木兰》之后,另一部经典中国传统故事版的“美国动画片”。想象一下,或许三年或者五年之后,我们将会像现在一样,站在电影院门外, 开始对新影片《白蛇传》“评头论足”。

中国故事踏上“外走”之路

说到《白蛇传》,赵雅芝温婉的“白娘子”,张曼玉妖娆的“小青”,台湾电视剧《新白娘子传奇》,香港电影《青蛇》离我们很近,影响也最深远。除此之外,内地多种戏曲流派都曾将这个凄美的故事淋漓尽致地演绎过,然而在动漫领域,我们则不得不汗颜。

事实上,美国梦工厂并非第一个发现《白蛇传》的深刻“内涵”的主儿,如今被称为日本动漫业界的泰斗宫崎骏,就是受《白蛇传》影响才逐渐走红。据悉四 十多年前,宫崎骏在日本一次绘画比赛中落榜了,他非常苦恼。就在这时候,他看到了日本影史上第一部长篇彩色电影动画片《白蛇传》,深受触动,从此走上漫画 家道路。可见该影片在日本的影响程度。

最近,国内有消息称央视动画组有意做《水漫金山》的动画系列片,而且要在全球征集动画人物造型,但面对梦工厂强大的实力和辉煌的战绩——《功夫熊猫》在中国一周横扫一亿多人民币票房——拱手相让《白蛇传》似乎已成定局。

从《花木兰》开始,除《白蛇传》之外,还有消息如迪士尼要改编《红楼梦》拍一部《宝玉》,斯皮尔伯格要拍《西游记》,中国故事踏上“外走”之路。虽 然都说国内动漫与国外有差距,但如果像《白蛇传》这样,流传时间长、故事曲折、深入人心的作品,一部一部的“外走”,中国的动漫究竟从何处下手方能崛起?

动画《白蛇传》国内能接招吗?

如果由国内挑起大梁拍《白蛇传》呢?敢接吗?能接吗?不会搞砸吗?记者采访了两种不同的制作机构,一方是市场中的动画公司,一方是校园中的动画专业,看看他们会如何接招?

代表一:***影视动画公司技术总监刘飞

代表二:西北大学艺术系动画专业主任任斌

记者:大家一直都说,中国动漫缺钱、缺人才,如果给你们公司足够的钱和人才,你们敢接《白蛇传》吗?接了能保证卖座吗?

***技术总监刘飞:从技术角度而言,我们接这个没有问题,因为硬件设施上我们与美国并没什么差距。但能不能卖座?一部动画电影卖座与否关系到三个 方面,一、制作好,二、故事好,三、市场推广好。而剧本、策划、制作角度,多种不可预测的因素我们无法预计,所以卖不卖座很难确定。

西大动画专业主任任斌:大制作、大的尝试我们也非常愿意,但现在由国内来制作,问题确实很多,我们心里多少有些忐忑不安。《白蛇传》的剧本大家都看 过,原来的故事是不符合现代人的欣赏水平的,改动本身就有难度。至于技术,我觉得现在依然很难达到要求,比如全西安据我了解,目前“运动捕捉”技术都很难 做到,更不要说其他。

记者:听说拍摄《狮子王》时,狮子的毛随风吹动,每一根都经过精密的计算。有传闻说,美国梦工厂这类的公司都拥有“秘密核心技术”,这种技术主要指什么,确实无法超越?

刘飞:每个动画片都要计算,只不过用得好用得坏而已。所谓的核心技术,其实就是每个公司都有的制作手法和技巧,看似神秘,事实上就是经常做,掌握了 一定的技巧,变成独有的一种东西。就好比做馒头,它再怎么变,配料都是一样的,只是比例稍有不同,但宣传的人多了,就是觉得这家的好吃。关于动画制作和市 场推广,他们的花钱比例是1比1的,只是国内做不到而已。而且目前大家不了解国内的制作公司,在技术上至少比同类的国内学科要快五年的水平。

任斌:核心技术我认为还是存在的,好比在某个场景中,他们需要一个镜头,有专门的编程人员去为这个场景编写程序以及运行,很多运用对于我们现在来说有难度。

记者:作为业内人士,能谈谈你们对中国故事“外走”的感受吗?切肤之痛还是心服口服?

刘飞:我不认同很多人说的这是美国的文化渗透,相反,我觉得这是中国文化在渗透别人,我们大家只看到1亿多人民币的中国票房,却没有看到2亿多美元的美国本土票房,美国梦工厂看重中国故事,总体而言是因为我们有不同,如果我们之间相同,它学我们又有什么意思,有什么看头?

任斌:既然一步一步被人“吃”,以后就只有一步一步把被别人吃过的市场再吃回来。我们的动漫弱小,就需要学习。

关于《白蛇传》的猜想

腾讯网络动漫频道主编马自军告诉记者:如果让国内拍,首先观众打一个问号。故事、剧情都是老套的,而且,从业内看来,到时候因为是老经典,肯定很多 人在拍摄过程中,都有所谓专家指点来指点去,制作者恐怕是有想法没做法,加上现在观众对国产动漫排斥的心理,一说是国产动画,都不愿意看,相反美国的,一 般大家都要带着批判的精神去看,结果往往被人家震撼了。不服气也没办法。其实,他们拿走经典名著,只要不是恶子,光着上身直去厨房,厨房真没劲随手拿了个东西是个西红柿,右手提了玻璃水壶便向阳台走去,哗啦哗啦地摇晃着玻璃水搞,我觉得都可以。

刘飞:说实话,咱们国内做动漫是正儿八经的,谁会把一个熊猫和功夫扯在一起,可人们就是喜欢看,如果咱自己做《白蛇传》,估计也是老套的忠贞感情,但美国做,说不定就整个婚外恋,不一定但充满可能。 本报记者 刘慧

看好中国题材不是文化侵略

从《花木兰》到《功夫熊猫》,现在又传出梦工厂要“动”《白蛇传》,这背后蕴涵着怎样的文化观念变迁。记者采访了青年评论家韩浩月,请他予以解读。

问题一:从《花木兰》开始,到《功夫熊猫》、材越来越吸引美目光,是迷恋中国文化,还是炫耀美国文化渗透实力?这背后蕴涵了怎样的文化观念?

韩浩月:美国不仅仅是看好中国题材,它看好世认为有文化侵传说、神话都是全人类共同的题材,何况我们也借鉴别人的科技。我工厂较为纯粹的商业目的, 它要的也是商业效益。如果说有渗透,那也是过去才有的,现在视野开阔,不存在这个问题。而且美国想要利用中国的影响,在全世界范围内找寻接受,不只是中国 观众。

问题二:《功夫熊猫》成功后,很多中国人为什么不服气?

韩浩月:不服气的大概多是从业者,只要是好看的,观众就会去看。中国电影长期的束缚压制了创作能力,即使给从业者一个开放的空间,也不一定能做出 来,这是东西方对于电影本质理解的不同造成的。最近有国产动画片《风云决》,找来谢霆锋配音,很多人只看了个片花就说,请了谢霆锋也白搭。我们很多人看了 《功夫熊猫》心里酸溜溜,认为他们没有我们对中国文化理解得深,却拍得比我们好看。我们没有他们善于对比,片面地追求深度,娱乐程度就不够,相反也是一 样,很难协调,这是我们的问题。

再有一个,中国经典在过去就形成了,后面的人再努力似乎都白搭,说明我们怀旧心理较重,就算自己拍《白蛇传》,估计也会骂声一片,跟重拍红楼梦一样 的结果。因为我们虽然知道故事核心,却不懂得打动人的细节,电影有它特殊的表达技巧,我们的动漫就好像我们的大片一样,即使有钱,缺乏创意性的想法,依然 不能对现代电影足够理解。

问题三:十年前的《花木兰》出来时,有很多质疑,认为太过“好莱坞”,但如今的《功夫熊猫》却将中国文化解读得较深,很贴近观众,说明了什么?

韩浩月:美国梦工厂确实下工夫研究中国文化、儒家思想。《功夫熊猫》的导演可以用三十年来研究中国文化,再花五年时间制作,确实对中国很熟悉,抓住 了中国元素的核心。但有一点,我要说的是他们这样做最大的驱动力,是出于利益考虑,不见得是对中国文化多热爱,他们只是针对一个点发力,其他的也许并不清 楚。

Pages: Prev 1 2 3 4 5 6 7 8 ...148 149 150 Next