存档

‘搜索引擎’ 分类的存档

几条简单而有效的SEM优化原则

2010年5月9日

为达到最佳 Google 关键词广告效果,Google 公司要求代理商按照以下标准为广告客户提供SEM优化,虽然是简单的原则,但是按照执行,可以起到很好的效果:

  • 多渠道投放广告,建议将搜索网络与内容网络广告分开预算。
  • 帐户关键字不少于50 个,并依照不同主题建立多个广告组;
  • 每组关键字最优数量在5-15 个之间;定期维护关键字列表,及时更改点击量低的关键字。

说明:广告系列按照关键字主题建立多个广告组,并在广告语标题中体现广告组的主题

  • 每个广告组建立至少两套以上不同特点的广告文字。
  • 将最为相关的网页作为广告组的目标网址。

质量筛选
CTR低于0.1%的关键字应该在再次优化的时候删除
对搜索无效的关键字数量不超过所有关键字数量的20% 
内容网络网络
每一个内容网络广告系列需具有至少3个否定关键字
任何一个广告组的关键字数量(5-30个)
改组关键字需共享一个词根
该组广告语内需包含至少一次本组的词根
对网站定位的广告,每个广告组的网站的数量不要超过15个

对于以上一些原则,也有SEM方面的朋友表示不同意见,值得参考一下。

VN:F [1.9.22_1171]
Rating: 1.0/10 (1 vote cast)
VN:F [1.9.22_1171]
Rating: 0 (from 0 votes)

搜索引擎 ,

Adwords否定关键词的匹配选项

2009年4月25日

虽然很多人可能使用过关键字匹配类型(match type),但是有多少人正在使用否定关键字匹配类型呢?作为一名早期的AdWords用户,下面介绍下否定关键词(negative keywords)的匹配类型,希望有助于提高关键字质量。 有三种类型的负面关键字:精确否定(negative exact),词组否定(negative phrase),否定(negative,实际是negative broad)。

精确否定当整个查询正好就是这个关键词才不会显示。词组否定将不会出现在任何含顺序显示该词组的查询中。否定(negative broad)只需要查询短语中含有了否定中所有的单词,即不会显示,和否定单词是否顺序出现以及是否相邻无关。

假设你购买了关键字“蓝色奔驰车的广泛匹配”。以下是如何将否定关键字“蓝色快”的不同匹配类型的,将如何影响此广告是否显示。

1)快速蓝(负)
可能的搜索关键词:
蓝色奔驰车 – 将显示
蓝色的快速奔驰车 – 不显
奔驰车快 – 将显示
蓝色奔驰车快 – 不显
快蓝色 – 不显
蓝色快 – 不显
快速蓝色奔驰车 – 不显

2) – “快蓝色”(负短语)
可能的搜索关键词:
蓝色奔驰车 – 将显示
蓝色的快速奔驰车 – 将显示
奔驰车快 – 将显示
蓝色奔驰车快 – 将显示
快蓝色 – 不显
蓝色快 – 将显示
快速蓝色奔驰车 – 不显

3) – [快(负精确蓝色])
可能的搜索关键词:
蓝色奔驰车 – 将显示
蓝色的快速奔驰车 – 将显示
奔驰车快 – 将显示
蓝色奔驰车快 – 将显示
快蓝色 – 不显
蓝色快 – 将显示

当含有10个以上单字时,exact match不再有效,因为只会读取前10个单字,然后进行包含运算。

VN:F [1.9.22_1171]
Rating: 10.0/10 (1 vote cast)
VN:F [1.9.22_1171]
Rating: 0 (from 0 votes)

搜索引擎

关键词投放管理工具

2009年3月6日

一直用google的关键词管理工具google adwords editor,最近又发现百度也有关键词管理工具软件了,叫adsage,可以和excel集成,没试过只有30天试用期,不是免费的我就不试了。有兴趣的可以试试。不过我觉得百度关键词除了导入导出,似乎也没什么太大使用软件的必要。

VN:F [1.9.22_1171]
Rating: 10.0/10 (1 vote cast)
VN:F [1.9.22_1171]
Rating: 0 (from 0 votes)

搜索引擎 ,

用Google Analytics 分析站内搜索

2009年2月26日

用Google Analytics 分析站内搜索可以帮助网站主了解用户关注的需求热点和不足,便于对网站内容、产品进行相应调整。操作方法如下:
在Google Analytics中选择左上角的”Analytics设置”,选择域名后修改域名配置文件,然后选择修改“主要网站配置文件信息”->”网站搜索”->”请跟踪网站搜索”

自定义查询参数:网站程序所使用的查询变量名,如本站用的是Wordpress,在搜索“google analytics”时URL为:
http://www.jefflei.cn/?s=google-analytics
则自定义查询参数为s,查询参数最多可设置5个,多个用半角逗号隔开。

google-analytics-site-search

分类:指站内搜索时,可在特定分类内进行信息搜索。设置分类参数可统计用户进行站内搜索时对网站哪些分类信息比较关注。
设置同样对应程序所定义的类别参数,例如使用 Google 高级搜索,搜索关键词SEO,指定文件类型为php文档,则搜索结果URL为:
http://www.google.com/search?as_q=google-analytics&as_filetype=php
结合第1点:as_q 为查询参数,as_filetype 为类别。类别参数也最多设置5个,用半角逗号隔开。

排除参数: 依据analytics配置文件中“排除网址查询参数”指定的排除项,若有需要排除的参数则勾选。

用google analytics跟踪站内搜索,主要的目的还是为了提高网站。如果网站本身有一定的流量,还是很可以从Google Analytics的站内搜索统计中看出一些有用的数据来的:

  • 用户搜索了哪些关键字?
  • 用户没有找到哪些内容?
  • 用户是在哪里进行搜索的?
  • 用户看到的是哪些网页?
  • 搜索后停留的时间、搜索深度……

  这些信息都有助于我们增加相关内容满足用户需求或者改进网站易用性,如,在搜索结果页面放置了帮助说明、搜索举例以及提出查询要求的链接等。

VN:F [1.9.22_1171]
Rating: 10.0/10 (1 vote cast)
VN:F [1.9.22_1171]
Rating: 0 (from 0 votes)

搜索引擎

几个Google Analytics的重要术语

2009年2月25日

有朋友说,GA中的一些术语看着晕,我想有必要对一些容易混淆的术语简单说明一下, GA的统计术语是符合WAA(Web Analytics Association)标准,我想可能跟GA的中文翻译用词都有些关系吧

第一组: 绝对唯一身份访问者,独立身份访问量,访问次数,综合浏览量

综合浏览量(PageView): 您网站被访问的页数。

独立身份访问量(Uniq PageView): 这个术语在”内容”->”最热内容”中可以看到统计内容和上面的Pageview类似,只是一次会话(session)中的多次访问只算一次。

访问数(Visits): 用户访问的次数,在30分钟内拥有同一个cookie的用户查看多个页面只算一次访问次数(visit),超过这一时间间隔无动作的,则算一次新的访问,这个三十分钟的时间间隔是可以自定义的。

绝对唯一身份访问者(Absolute Uniq Visitor): 相当于WAA metrics defnition中的uniq visitor,这个绝对唯一身份访客指你所需要统计的具体时间段之内的唯一cookie的访客。

第二组术语:跳出率,退出率

跳出率(Bounce Rate)
首先了解”跳出”的概念,跳出(Bounce)简单来说,就是进入网站后,只看了一页就离开了。
跳出率就等于(只看了一页就离开了的访客数)÷(进入的访客总数),如下图。
google-analytics-bounce-rate
需要注意的是,这个跳出率和高级群体(Customer Segmentation)和事件跟踪也是相关的。比如你对流量视频进行了事件跟踪,那么当用户访问页面上流量了视频,那么这个就不算“跳出”了。

退出率(Page Exit Ratio):从当前页退出的次数,与该页总访问数(PV)相除得到的比率
goolge-analytics-exit-rate

我们需要关注网站中的重点页面的退出率如注册的不同步骤,以及电商网站的购物车、结算、付款等,退出率太高就要从网站、流程、定位上找问题。

VN:F [1.9.22_1171]
Rating: 6.0/10 (2 votes cast)
VN:F [1.9.22_1171]
Rating: +1 (from 1 vote)

搜索引擎

SEO之降低相似页面

2009年2月5日

最近buy域下被百度收录页面大幅下降,从awstats上的baidu蜘蛛抓取记录来看,也从每天1500页降低到100页左右。很是头痛,和同事商量了一下发现是类似页面的问题:

baidu-similar-items

点击进取之后,发现很多商品介绍页面被百度当成是相似条目。

我们翻开页面,可以看到几个问题:

1. 页面最上端是导航
2. 接下来是商品分类
3. 终于出现了商品的主体内容,但是这里面有一大段品牌介绍,而这段介绍是很多该品牌下的商品共有的,也就是这里导致了这些页面被当作类似条目
4. 商品的图片链接中没有alt的文字介绍
5. 商品详细图片页面是js弹出页面,而搜索引擎一般不会收录js,因此未被收录

解决方法,第一,第二项的解决方法在上一篇百度搜索结果中的描述中已经介绍过了,第五项可以用<noscript>中增加链接的方式,让搜索引擎知道图片链接,在用户关闭JS的情况下这也提高了网页的友好性。关于第三项,有3项措施可以采取:
1. 编辑需要多输入详细信息
2. 可以用程序生成一段和商品名称,品牌,分类相关的描述,放在编辑描写的最上部。
3. 将属性等信息尽量提前
——————–
2009.2.26日补充
4. 将送货方式,退货规定等所有页面都一样的大量文字用js输出
用<a hre=”/website-analysis-tools#page-similarity-check“>页面相似度检测工具</a>检测

VN:F [1.9.22_1171]
Rating: 0.0/10 (0 votes cast)
VN:F [1.9.22_1171]
Rating: 0 (from 0 votes)

搜索引擎

页面摘要的改进

2009年2月4日

昨天发现一个问题,Google索引比较严格地遵守了在显示结果用用网站的Meta Description描述,而百度中的描述并不严格遵守Meta里面的description部分,而是在有的情况下自动抓取文章中内容摘要作为网站描述。baidue search result example
这段内容称为页面摘要(Snippet),完整而有效的页面摘要能帮助用户在搜索结果中点击我们的网站,对网站在搜索结果中的长期排名是有一定帮助的。
页面摘要的长度
百度页面摘要为220个(或110个汉字)左右,含标点符号,而Google页面摘要为240个字符(或120个汉字)左右。
如何不显示DMOZ的网站描述
有时候google会用DMOZ的网站描述替代你的Meta作为网站摘要,如果你不希望用DMOZ的网站摘要,那么可以在页面头部中用下面这句:
<meta name=”page snippet” content=”NOODP”>
百度页面摘要是怎么生成的
根据我的观察,搜索结果中有时候出现Meta Description,而有时候会自动根据页面内容产生网页摘要呢。猜测是百度认为页面和描述比较相关,就会引用描述,我想这是由于国内黑帽SEO手法太多的缘故。我们可以看到,通常情况下都是抓取页面的最上部分的文字。”蜘蛛”爬行网页的顺序,通常都是从上到下,从左到右,其实这也是人们阅读网页的习惯,总是首先看到第一屏的内容,既然知道”蜘蛛”是这样爬的,那它捉取网页内容必然会遵循次原则。
这让我想到前阵子point和我介绍的smarter的网站设计,他们在HTML中把导航部分放在页面下部,只是通过css把这个导航的div在浏览器显示的时候放在顶部,这样帮助蜘蛛标示内容,所以在smarter的搜索结果中,更多地显示了desription,即使不显示description,文字描述也不会很乱. 这个方法值得借鉴,尤其在ViewItem(商品详情)页面。
 
当然这个方法也不能完全避免百度显示中间的内容,有时百度也会抓取页面中间的内容。这个和密度和相关性很有关系,这对我们的编辑提出了一定的要求。那么概括一下可以采取的行动:
1. 页面的导航部分放在html的下部
2. 将二级商品分类也显示在html的下部,并用css将其放在左测或右侧,使得页面主体部分显示在HTML的比较前面(其实wordpress等博客都是这么做的)
3. 编辑在编辑title和description中的关键词时,必须要和商品标题和商品描述有呼应
其实网站的用户不仅仅是普通用户,还有搜索引擎–从服务器日志来看目前我们每天有近40%访问是来自于搜索引擎的spider。

接下来,让我们看一个网站的黑帽手法,这是一个反面教材,希望大家引以为戒。使用这种SEO手法一旦被识别,很容易被搜索引擎关禁闭:

seo-black

这是一个国内有一定规模的鞋类电子商务网站,具体哪个网站我就不说了,虽然把主要描述提到最前面对搜索引擎读取很有帮助,但是该网站为了节约用CSS调整页面的时间,直接把商品信息放在页面最上部,而用css调整为用户看不到这段信息,显然这是只给搜索引擎看得,这种玩弄搜索引擎的方法是标准的黑帽手法,一旦被发现很有可能会被搜索引擎屏蔽。

看过了反面教材,最后介绍两个比较好的例子:

高质量页面摘要赏析:http://hi.baidu.com/womanv/blog/item/125d11eaa63ab8d6d439c987.html

页面摘要改进案例:http://www.admin5.com/article/20081220/122085.shtml

VN:F [1.9.22_1171]
Rating: 0.0/10 (0 votes cast)
VN:F [1.9.22_1171]
Rating: 0 (from 0 votes)

搜索引擎

SosoSpider及恶意蜘蛛屏蔽

2009年1月29日

最近从网络日志看到有很多陕西电信IDC的访问,占我们www总访问数的一半,ip都是124.115.0.X和124.115.4.X,总共约有60多个IP。网上搜索了一下,发现这是sosospider,文章参见:

http://www.wangzhongyuan.com/archives/522.html
http://www.cnzzr.cn/2008/02/sosospider-124-115.html

由于这个sosospider不遵守行规,不读取robots.txt,并且User-agents中没有spider信息,而且还带有referer,伪装成普通用户,封闭的办法只有禁止IP:

Order Allow,Deny
Allow from all
Deny from 124.115.4. env=bad_bot
Deny from 124.115.0. env=bad_bot

注意这里deny和allow的顺序,对于其他恶意搜索引擎,可以用:

SetEnvIfNoCase User-Agent “Indy Library” bad_bot

Order Allow,Deny
Allow from all
Deny from env=bad_bot

nginx配置如下:

location / {
    deny   124.115.4.0/24;
deny 124.115.0.0/24;
    allow    all;
}

VN:F [1.9.22_1171]
Rating: 0.0/10 (0 votes cast)
VN:F [1.9.22_1171]
Rating: 0 (from 0 votes)

搜索引擎, 系统管理

为Awstats添加自己想要的Extra(扩展)

2009年1月16日

Awstats允许我们在其标准日志统计报表之外,通过Awstats Extra Sections添加自定义报表,当然每一个Extra section将使Awsats的处理速度降低 8%, 而且错误的设置会导致Awstat耗用过多内存,导致awstat处理失败。
Extra Section可以有多个报表,每个报表有一组参数,以数字为标号。如以下X是一个数字,可以按1,2…编下去,为组号的标号:
ExtraSectionNameX 自定义图表的名称.
ExtraSectionCodeFilterX 必须要匹配的记录中返回代码,比如http日志中的 200 304,空字符不做检测
ExtraSectionConditionX 用来计数的条件,满足的行做计数处理,使用以下条件 (URL,URLWITHQUERY,QUERY_STRING,REFERER,UA,HOST,extraX)
并在逗号后面用regex来测试满足条件的字符串, 可以使用 “||” 当作 “OR” 做多个项之间的并列条件.
ExtraSectionFirstColumnTitleX 图表第一列的标题
ExtraSectionFirstColumnValuesX 给定条件字段中获取行值的一个regex格式字符串(同行条件部分,不同点是前面是测试满足条件的行,这儿是提取满足条件的值,做结果报表中的行值)
(URL,URLWITHQUERY,QUERY_STRING,REFERER,UA,HOST,VHOST,extraX)逗号跟regex提取值表达式
每个找到的不同值将在列表中有一行数据,计数的值将出现在该行的第一列. 确认获取到的不同值列表是可预计的(不会无限扩展,撑破内存)。例:
ExtraSectionFirstColumnValues1="URL,^\/blog\/([\w]+)\.html"
ExtraSectionFirstColumnFormatX 用来输出值的字符串,如:

ExtraSectionFirstColumnFormat2="<a href='/blog/archives/%s.html' target='new'>%s</a>"
ExtraSectionStatTypesX 想要计数的类型,可以使用标准代码字符(见本文最后的说明).
ExtraSectionAddAverageRowX 在底部添加一个平均值行
ExtraSectionAddSumRowX 在底部添加一个合计行
MaxNbOfExtraX 在图表中显示的最大行数
MinHitExtraX 要在图表中做显示的最小值

统计列说明

在ExtraSectionStatTypes中只有PHBL这几个字段有效
U = Unique visitors
V = Visits
P = Number of pages
H = Number of hits (or mails)
B = Bandwith (or total mail size for mail logs)
L = Last access date
E = Entry pages
X = Exit pages
C = Web compression (mod_gzip,mod_deflate)

VN:F [1.9.22_1171]
Rating: 5.5/10 (2 votes cast)
VN:F [1.9.22_1171]
Rating: 0 (from 0 votes)

搜索引擎, 系统管理 ,

如何在多域名和多子域名情况下用Google Analytics统计

2009年1月15日

我们已经知道,如果你要跟踪第三方购物车等多域名_setDomainName(“none”),如果你要用GA跟踪多子域,那么应该用_setDomainName(“mymainsite.com”) ,那么如果你既有多域名,又使用第三方购物车,那么应该如何设置呢?可以在本站用考虑设置如下代码:

<script type=”text/javascript”>
var gaJsHost = ((“https:” == document.location.protocol) ? “https://
ssl.” : “http://www.”);
document.write(unescape(“%3Cscript src='” + gaJsHost + “google-
analytics.com/ga.js’ type=’text/javascript’%3E%3C/script%3E”));
</script>
<script type=”text/javascript”>
var pageTracker = _gat._getTracker(“UA-XXXXXXX-1”);

pageTracker._initData();
pageTracker._setAllowHash(false);
pageTracker._setDomainName(“mymainsite.com”);
pageTracker._setAllowLinker(true);

pageTracker._trackPageview();
</script>

其中SetAllowHash等各个函数的作用,参照GA Migration Guide. 以上所有设置的前提是你能在第三方购物车上安装google analytics代码,如果是你不可以在第三方购物车上安装GA代码请参考如何用跟踪第三方购物车

VN:F [1.9.22_1171]
Rating: 9.0/10 (1 vote cast)
VN:F [1.9.22_1171]
Rating: 0 (from 0 votes)

搜索引擎 ,