“内容为王,外链为皇,内链为妃,关键词为相,代码为将,结构为城,更新为太子”
做seo很大程度是做关键词排名。把关键词做到首页是做seo的基本目标,有首页排名才有更好的展现机会,才可能有更好的转化率。
一、搜索原理
网络蜘蛛即WebSpider,如果把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛。网络蜘蛛是通过网页的链接地址来寻找网页,从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有网页都抓取完为止。如果把整个互联网当成一个网站,那么网络蜘蛛就可以用这个原理把互联网上所有的网页都抓取下来。
1、抓取
搜索引擎会和普通访问者一样,顺着网页上的链接一个个下载我们的网页,为下一步的预处理做准备。
2、预处理
①.判断是否符合其收录规则,符合收录规则的再继续处理
②.对文章进行分词处理
把网页中的文章切成一个个的词语。度量文档之间的相关性,以及为建立倒排索引做准备。并记录词出现的位置。
③. 建立倒排索引
在搜索引擎中每个文件都对应一个文件ID,文件内容被表示为一系列关键词的集合
把文件ID对应到关键词的映射转换为关键词到文件ID的映射。
用词来索引网页,好处在于:搜索引擎的用户输入的也是词,这样可以方便地查找到相关的网页。
3、检索
①.对用户查询的关键词进行分词,取索引的交集
②.排序
重要性——网页静态质量得分。搜索引擎把网站的各种表现情况转换成一个个分值,这些分值加起来,就得到一个页面的质量得分,即所谓的权重。
a、页面信噪比:
页面信噪比是指页面内正文与非正文的比例,页面信噪比至少要大于1。
b、稀缺性
c、链接控制:
链接控制分链接数量和链接自然性。一个页面权重是固定的,链接可以传递权重,链接越多,每一个链接传递的权重越低。
d、页面的浏览量
相关性——上面通过倒排索引只能定性地知道网页和查询词之间是否相关,但谁更相关即定量是没办法知道的。百度处理方式:
a、记录词出现的位置,不同位置的关键词权重不同。
b、tf-idf算法,即一个词在一篇文章中出现的次数最多,这个词的权重越高;一个词在整个互联网中出现的次数越多,(如“我”、“的”这种词,对于一篇文章主题的鉴别能力不强,每篇文章几乎都出现)这个词的权重越小。
4、常用的高级搜索指令:
site: SEO 最熟悉的高级搜索指令,用来搜索某个域名下的所有文件。
inurl: 指令用于搜索查询词出现在url 中的页面。
intitle: 指令返回的是页面title 中包含关键词的页面。
domain: 其作用就是来查询域名下的反链(反链=外链+内链)。
二、索引排名
1、收录与索引
收录:页面被Baiduspider发现、分析过
索引:Baiduspider经初步分析后认为有意义,做建库处理
收录索引的关系是包含关系,先收录才可以建索引,收录量大于索引量。
百度表示第三方提供的所谓收录查询都是不靠谱的。
1-1、索引文章决定因素:
信任度;
文章质量;
更新频率;
网站结构;
熊掌号、站点地图对百度收录有促进效果;
网站的年龄以及权重影响着百度对网站的收录效果。
1-2、加快页面索引方法:
做好网站TDK,并不要修改;
积累高质量网站内容;
每日定时定量的更新;
提交百度等搜索引擎,包括sitemap、熊掌号等;
重点做好熊掌号,目前熊掌号提交已能实现移动站收录80%以上;
有针对性并有规律的发布高质量外链。
2、文章质量判断(百度官方)
①. 受众
受众群体的大小,即代表了用户检索需求的大小。
②. 稀缺
稀缺主要是描述页面在互联网中的独特性。
③. 质量
a不能是死链、网站访问速度是否令人满意。
b主体内容是否完整、版式和字体是否易读、各类广告会不会太多。
c信息是否丰富、延伸出的次级需求是否满足。
④. 时效
3、原创识别判断
①.发布时间——蜘蛛抓取的日期
②.锚文本链接——网站页面外链的多少
③.信息指纹——文章内容雷同相似的程度
4、标题优化方法
从搜索引擎搜索到的内容的标题往往是网页title的内容,搜索引擎给与标题的权重很高。
①.标题通顺、吸引人、符合文章实际。
②.标题一定要原创,包含核心关键词和长尾词,与内容关键词保持一致
③.写作要符合搜索引擎习惯,少用标点
④.长度要合适,控制在二十二个汉字以内
5、内容优化方法
主要分为两部分:一部分是原创/伪原创,另一部分是采集素材库审核。
至少首段需要纯原创,且最好是有搜索可能的内容,整段以玩家搜索需求来写。
正文最好分小标题有条理的展开
以内容价值为主 伪原创方法
寻找有价值的文章,最好是当天发布的,也可利用爬虫抓取的数据库改写
有价值的文章具有很好的可读性、目标明确、能够吸引人的眼球。
①、修改文章的首尾部分:
首尾段重新概括,把正文里面的顺序打乱,把一些不相关的去掉。加入观点。
②、拆分重组原文:找几篇相关性比较强的文章组合成一篇新的文章
③、相关内容的合并组合
④、翻译其他语言的文章
⑤、利用论坛、博客、新媒体等挖掘文章
6、图片优化方法
搜索引擎对于大多数图片的原创性的识别已经具备一定能力
针对图片的算法主要有计算哈希值、pHash算法和SIFT算法,及将目标图像进行编码,形成“指纹”存储起来。
①.在图片上加水印;
②.改变原有图片的长宽尺寸比,或者直接截取某一部分图片;
③.图片长宽比尽量接近121*75,也就是接近百度搜索展示的缩略图尺寸;
④.缩略图内链,与文字链接相比较,更能吸引访客去点击,注意相关性。
⑤.加上alt描述,可以增强页面关键词主题,但注意千万不要堆砌关键词。
⑥.百度对原创内容越来越喜欢,实际上图片也是页面的一部分。
7、关键词优化方法
关键词分类:核心关键词;相关关键词;长尾关键词;错误关键词;生僻关键词
①、要站在用户的角度考虑,多想想用户在搜索时会使用什么词
②、不超过5个,一般3个:主关键词、副关键词、一个潜力的长尾关键词
③、关键词密度不超过2%—8%(根据需要,不绝对)
7-1怎样筛选合适的主关键词
①、搜索量和曝光量相对较高
a百度指数:
b百度风云榜:
c各个线上渠道媒体、微信微博等曝光度:
②、竞争度相对较小
看一个关键词竞争度大小可以从以下方面着手:
a第1页搜索结果中主页排名占比
当把一个关键词放在搜索引擎中搜索的时候,我们可以查看一下首页排名网站中以主页形式存在有多少,如果主页排名网站占比很大,说明这个词竞争度也比较大
b竞争对手网站权重怎么样
除了主页排名,还有就是看看参与首页网站排名中主域权重怎么样,将对方网站主域放在站长工具中搜索一下,看看对方权重怎么样。如果普遍较高说明竞争难度也挺大。
c关键词搜索结果数
搜索引擎下出现的相关搜索结果表示它数据库网页中有多少个网页出现所搜索的这个关键词,从某种程度上也可以间接的反映这个词的热度。
d关键词参与竞价网站数目
通过参与竞价的网站数量可以反映出这个词的商业价值高不高,也就间接反映了关键词的竞争度,说明用户搜索需求比较大,或者这个词精准性比较强。
7-2关键词放什么位置好
①内容中自然分布关键词,应该在文章的每个段落里;
②网页头部标签(如:tdk)应该放着关键词;
③网页上图片的ALT标签里应该写上关键词;
④在H1标签中加入关键词;
⑤内容评论中出现关键词;
⑥URL中体现英文关键词;
⑦链出链接锚文字中包含关键词,并注意锚文字要多样化。
7-3怎样筛选合适的长尾关键词
①百度下拉框和相关搜索;
②字母A-Z、空格等继续铺词。
三、用户转化
用户搜索到页面后,能否带来转化取决于是否符合用户的需求和潜在需求
主要在页面设计、内容结构上予以优化,做好用户体验和引导下载。
四、SEO思维方向
1.内容建设:是不是当前广大用户需求的内容?
2 .竞争对手:对手都是怎么在做的?我们如何差异化?
3.协调资源:我们该协调哪些资源来促成优化改进?
4.站内优化:把seo细节做到极致
5.站外优化:如何进行链接推广
6.迭代优化:数据分析促进改进页面体验
五、SEO常用工具&相关网站
百度站长平台
百度统计/CNZZ
金花站长工具/追词;爱站/站长工具等
站长之家:http://www.chinaz.com/
六、百度搜索相关算法
1.惊雷算法 打击刷点击作弊行为
2.闪电算法 打压加载非常慢(3秒及以上)的网页
3-1.清风算法 百度推出清风算法,严惩网页标题作弊
3-2.清风算法2.0 打击实际下载资源与需求不符和提供了下载链接实际站点无下载资源
4.飓风算法 打击恶劣采集
5.蓝天算法 打击新闻源售卖软文、目录行为
6.天网算法 打击盗取用户隐私行为
7-1.冰桶算法4.0 打击移动搜索结果页广告过多、影响用户体验的页面
7-2.冰桶算法4.5 打击发布恶劣诱导类广告的页面
8.石榴算法 打击PC端网站页面广告过多影响用户体验行为
9.绿萝算法 打击超链买卖行为