现在很多博主都喜欢用 WordPress 博客程序来给自己搭建一个个人独立博客,而且很多都是新手建的新站,我们在运营网站的时候肯定是希望查看我们当前的网站的运行状态,内容是不是有被搜索引擎抓取。在发表了几篇文章后会经常关注搜索引擎的收录情况,不过很遗憾,搜索引擎都有一个考核期,这样很多新站刚开始的时候就不会被收录,最后就会想,搜索引擎的蜘蛛到底来过没有啊?其实查看蜘蛛来访记录的方法很多,有插件、后台日志查看等,不过最近我收藏了一个用代码来实现的小方法,用过之后感觉还挺好的,所以放在这里和需要的朋友分享一下吧!
下面我给大家记录一下无插件,仅需要几行代码就可以轻松实现查看网站蜘蛛爬行记录。
- function get_naps_bot(){
- $useragent = strtolower($_SERVER['HTTP_USER_AGENT']);
- if (strpos($useragent, 'googlebot') !== false){
- return 'Googlebot';
- }
- if (strpos($useragent, 'msnbot') !== false){
- return 'MSNbot';
- }
- if (strpos($useragent, 'slurp') !== false){
- return 'Yahoobot';
- }
- if (strpos($useragent, 'baiduspider') !== false){
- return 'Baiduspider';
- }
- if (strpos($useragent, 'sohu-search') !== false){
- return 'Sohubot';
- }
- if (strpos($useragent, 'lycos') !== false){
- return 'Lycos';
- }
- if (strpos($useragent, 'robozilla') !== false){
- return 'Robozilla';
- }
- return false;
- }
- function nowtime(){
- date_default_timezone_set('Asia/Shanghai');
- $date=date("Y-m-d.G:i:s");
- return $date;
- }
- $searchbot = get_naps_bot();
- if ($searchbot) {
- $tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']);
- $url=$_SERVER['HTTP_REFERER'];
- $file="robotslogs.txt";
- $time=nowtime();
- $data=fopen($file,"a");
- $PR="$_SERVER[REQUEST_URI]";
- fwrite($data,"Time:$time robot:$searchbot URL:$tlc_thispage\n page:$PR\r\n");
- fclose($data);
- }
然后我们将代码插入到当前的主题 Functions.php 文件中,然后我们需要在网站根目录创建一个文件,文件名命名为:robotslogs.txt。
并且需要给予写入的权限。这样,我们可以通过这个 TXT 文本定期检查是不是有蜘蛛爬行记录。我们还可以利用这个日志文件进行可视化数据展现,这个需要用到数据调取方式。