注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

韩国恺的博客

hanguokai.com

 
 
 

日志

 
 

搜索引擎关键字识别  

2011-09-22 12:23:15|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
自己实际测试后整理如下:

 搜索引擎域名关键字URL参数默认字符集 字符集URL参数 
 Google * q utf-8 ie
 百度 www.baidu.com,www.baidu.jp wd 或 word gb2312(日本是utf-8) ie
 Yahoo! * p  (雅虎中国是q) utf-8 ei
 搜搜 www.soso.com w gb2312 ie
 有道 www.youdao.com q utf-8 ue
 搜狗 www.sogou.com query gb2312 
 Bing * q utf-8 

说明
域名 * 表示有多种,不同国家/地区可能不同,比如:雅虎美国search.yahoo.com,雅虎台湾tw.search.yahoo.com,雅虎日本search.yahoo.co.jp,雅虎中国www.yahoo.cn。

搜索关键字被url encode后作为搜索url的一个参数的值,如q、wd、query等。
关键字本身采用的字符集的处理规则是,如果不指定则搜索引擎采用其默认字符集,如果通过参数指定了字符集则采用指定的字符集。
另外发现:百度、sogou貌似可以自动判断utf8还是gbk,即使没有给出编码参数且不是其默认的也可以正确判断出来。

字符集URL参数示例:ie=gb2312  ie=GB2312  ie=UTF-8 ie=utf-8   ie=gbk ,ei=utf-8,ue=gbk  ue=utf8。字符集与大小写无关,utf8、utf-8都可以。

注意:google的加密搜索(https)结果无法从referrer 获取关键字,因为google去掉了其中q的参数值,只能知道是从google搜索过来的。
  评论这张
 
阅读(1334)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2018