杰拉斯的博客

[SEO]利用Ping服务通知搜索引擎博客更新的原理与代码实现

杰拉斯 杰拉斯 | 时间:2012-08-14, Tue | 39,077 views
后台技术 

什么是Ping服务

Ping服务是基于XML_RPC标准协议的更新通告服务,当博客内容发生更新时,可以向搜索引擎发出通知,而搜索引擎接收到通知后将派出蜘蛛对博客进行更新或收录。

如何Ping服务

Ping服务的使用方式有两种,一种是利用搜索引擎的博客提交页面进行提交,第二种是使用博客程序中的Ping功能,如WordPress自带的更新服务(设置-撰写-更新服务),或者Typecho Ping插件。具体的提交地址请参考《[SEO]在线Ping服务地址与RPC服务地址集合》

Ping请求包的例子

  1. POST /ping/RPC2 HTTP/1.0
  2. User-Agent: request
  3. Host: ping.baidu.com
  4. Content-Type: text/xml
  5. Content-Length: 511
  6.  
  7. <?xml version="1.0" encoding="UTF-8"?>
  8. <methodCall>
  9. <methodName>weblogUpdates.extendedPing</methodName>
  10. <params>
  11. <param>
  12. <value>博客名称</value>
  13. </param>
  14. <param>
  15. <value>博客地址</value>
  16. </param>
  17. <param>
  18. <value>文章地址</value>
  19. </param>
  20. <param>
  21. <value>RSS地址</value>
  22. </param>
  23. </params>
  24. </methodCall>

需要说明的一点是百度的规范比较奇葩,数据需要以<string>标签包裹:

  1. POST /ping/RPC2 HTTP/1.0
  2. User-Agent: request
  3. Host: ping.baidu.com
  4. Content-Type: text/xml
  5. Content-Length: 511
  6.  
  7. <?xml version="1.0" encoding="UTF-8"?>
  8. <methodCall>
  9. <methodName>weblogUpdates.extendedPing</methodName>
  10. <params>
  11. <param>
  12. <value><string>博客名称</string></value>
  13. </param>
  14. <param>
  15. <value><string>博客地址</string></value>
  16. </param>
  17. <param>
  18. <value><string>文章地址</string></value>
  19. </param>
  20. <param>
  21. <value><string>RSS地址</string></value>
  22. </param>
  23. </params>
  24. </methodCall>

可以看出,请求方式应为POST,而各个搜索引擎的返回形式不尽相同,但均是以0表示推送成功,1表示失败。

以百度为例子:

推送成功时的服务器响应包为:

  1. HTTP/1.1 200 OK
  2. Date: Mon, 11 May 2009 11:54:53 GMT
  3. Content-Length: 156
  4. Connection: close
  5. Content-Type: text/xml
  6.  
  7. <?xml version="1.0" encoding="UTF-8"?><methodResponse>
  8. <params>
  9. <param>
  10. <value>
  11. <int>0</int>
  12. </value>
  13. </param>
  14. </params>
  15. </methodResponse>

推送失败时的服务器响应包为:

  1. HTTP/1.1 200 OK
  2. Date: Mon, 11 May 2009 11:54:53 GMT
  3. Content-Length: 156
  4. Connection: close
  5. Content-Type: text/xml
  6.  
  7. <?xml version="1.0" encoding="UTF-8"?><methodResponse>
  8. <params>
  9. <param>
  10. <value>
  11. <int>1</int>
  12. </value>
  13. </param>
  14. </params>
  15. </methodResponse>

具体可参考百度Ping服务帮助谷歌Ping服务帮助

代码实现

原理很简单,使用PHP的cURL进行POST推送:

  1. <?php
  2. function ping($server, $xml) {
  3. $ch = curl_init();
  4. $headers = array(
  5. "Content-type: text/xml;charset=\"utf-8\"",
  6. "Accept: text/xml"
  7. );
  8. curl_setopt_array(
  9. $ch,
  10. array(
  11. CURLOPT_URL => $server,
  12. CURLOPT_RETURNTRANSFER => true,
  13. CURLOPT_POST => true,
  14. CURLOPT_HTTPHEADER => $headers,
  15. CURLOPT_POSTFIELDS => $xml
  16. )
  17. );
  18. return curl_exec($ch);
  19. }
  20. $xml = '<?xml version="1.0" encoding="UTF-8"?>
  21. <methodCall>
  22. <methodName>weblogUpdates.extendedPing</methodName>
  23. <params>
  24. <param><value>博客名称</value></param>
  25. <param><value>博客地址</value></param>
  26. <param><value>文章地址</value></param>
  27. <param><value>RSS地址</value></param>
  28. </params>
  29. </methodCall>';
  30. $res = ping('http://blogsearch.google.com/ping/RPC2', $xml);
  31. echo $res;
  32. ?>

若返回0,则说明推送成功,具体的拓展与应用蓝飞在这里就不再赘述了,留给大家自由发挥吧O(∩_∩)O~

如需转载请注明出处:杰拉斯的博客

相关文章

12 条评论 »

  1. 支持一个,还在读书呀,话说你这个还是新博客吧!

    1. 也不算很新了,是域名比较新,之前用的是SAE的二级域名。

  2. 好东西,过来MARK一下,肯定用得着。

  3. 我下载了这个东西,但是不知道是干什么的。。求解答

  4. 感谢分享,不过ping也不能肯定就是能被收录,重点还是在于页面的内容。

  5. 请问最后这个代码实现的代码应该放在哪里呢?是放在后台写文章的php页面里还是怎么弄,求指教

    1. 在提交文章的PHP中。

  6. jim jim

    可以应用到B2B商业网站吗?