!
也想出现在这里? 联系我们
广告位

代码实现WordPress获取搜索引擎蜘蛛抓取记录

现在很多博主都喜欢用 WordPress 博客程序来给自己搭建一个个人独立博客,而且很多都是新手建的新站,我们在运营网站的时候肯定是希望查看我们当前的网站的运行状态,内容是不是有被搜索引擎抓取。在发表了几篇文章后会经常关注搜索引擎的收录情况,不过很遗憾,搜索引擎都有一个考核期,这样很多新站刚开始的时候就不会被收录,最后就会想,搜索引擎的蜘蛛到底来过没有啊?其实查看蜘蛛来访记录的方法很多,有插件、后台日志查看等,不过最近我收藏了一个用代码来实现的小方法,用过之后感觉还挺好的,所以放在这里和需要的朋友分享一下吧!

下面我给大家记录一下无插件,仅需要几行代码就可以轻松实现查看网站蜘蛛爬行记录。

  1. function get_naps_bot(){
  2. $useragent = strtolower($_SERVER['HTTP_USER_AGENT']);
  3. if (strpos($useragent, 'googlebot') !== false){
  4. return 'Googlebot';
  5. }
  6. if (strpos($useragent, 'msnbot') !== false){
  7. return 'MSNbot';
  8. }
  9. if (strpos($useragent, 'slurp') !== false){
  10. return 'Yahoobot';
  11. }
  12. if (strpos($useragent, 'baiduspider') !== false){
  13. return 'Baiduspider';
  14. }
  15. if (strpos($useragent, 'sohu-search') !== false){
  16. return 'Sohubot';
  17. }
  18. if (strpos($useragent, 'lycos') !== false){
  19. return 'Lycos';
  20. }
  21. if (strpos($useragent, 'robozilla') !== false){
  22. return 'Robozilla';
  23. }
  24. return false;
  25. }
  26. function nowtime(){
  27. date_default_timezone_set('Asia/Shanghai');
  28. $date=date("Y-m-d.G:i:s");
  29. return $date;
  30. }
  31. $searchbot = get_naps_bot();
  32. if ($searchbot) {
  33. $tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']);
  34. $url=$_SERVER['HTTP_REFERER'];
  35. $file="robotslogs.txt";
  36. $time=nowtime();
  37. $data=fopen($file,"a");
  38. $PR="$_SERVER[REQUEST_URI]";
  39. fwrite($data,"Time:$time robot:$searchbot URL:$tlc_thispage\n page:$PR\r\n");
  40. fclose($data);
  41. }

然后我们将代码插入到当前的主题 Functions.php 文件中,然后我们需要在网站根目录创建一个文件,文件名命名为:robotslogs.txt。

并且需要给予写入的权限。这样,我们可以通过这个 TXT 文本定期检查是不是有蜘蛛爬行记录。我们还可以利用这个日志文件进行可视化数据展现,这个需要用到数据调取方式。

给TA打赏
共{{data.count}}人
人已打赏
WordPress教程

WordPress 建站内容中的图片防盗的几个有效方法

2023-2-4 14:13:52

WordPress教程

Gutenberg 古登堡编辑器开启自定义字段模块方法

2023-2-6 14:13:48

下载说明

  • 1、微码盒所提供的压缩包若无特别说明,解压密码均为weimahe.com
  • 2、下载后文件若为压缩包格式,请安装7Z软件或者其它压缩软件进行解压;
  • 3、文件比较大的时候,建议使用下载工具进行下载,浏览器下载有时候会自动中断,导致下载错误;
  • 4、资源可能会由于内容问题被和谐,导致下载链接不可用,遇到此问题,请到文章页面进行反馈,以便微码盒及时进行更新;
  • 5、其他下载问题请自行搜索教程,这里不一一讲解。

站长声明

本站大部分下载资源收集于网络,只做学习和交流使用,版权归原作者所有;若为付费资源,请在下载后24小时之内自觉删除;若作商业用途,请到原网站购买;由于未及时购买和付费发生的侵权行为,与本站无关。本站发布的内容若侵犯到您的权益,请联系本站删除,我们将及时处理!
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索