首先,什么是搜索引擎
百度、360、谷歌、必应、雅虎等。都是搜索引擎的具体表现。具体解释可以去百度,这里就不赘述了。
第二,什么是搜索引擎蜘蛛
搜索引擎蜘蛛是搜索引擎的程序,是信息抓取系统的程序。
常见的蜘蛛有白蜘蛛、绿蜘蛛、360白蜘蛛、搜狗新闻蜘蛛等
第三,什么是seo
seo指的是搜索引擎优化,也叫网站优化。搜索引擎优化不容易。在几百万甚至几千万的竞争对手中,我们的目标不是跻身前百,而是争取前十甚至第一。这可能是搜索引擎优化初学者的梦想,但在搜索引擎优化的心目中,我们的目标是实现它。
4.有哪些关键词?
关键词是指参与排名的每一个短语。从某种程度上说,seo优化也是关键词的排名优化。关键词优化的直接体现就是网站标题的排名(由关键词组成);另一方面,每个标题的排名是包含在标题中的页面的排名。
理论上每个页面都有参与排名的机会,所以网站排名的最小单位就是页面。
第五,搜索引擎的抓取和收录原则(四个流程)
1.夺取
2.过滤
3.存储索引库
4.显示排序
搜索引擎的抓取和包含流程图
蜘蛛抓取——网站页面——存储在临时索引数据库——中的排名情况(从索引数据库中检索)
评论:
临时索引数据库不存储蜘蛛抓取的所有网页。
他会根据蜘蛛抓取的页面质量进行过滤,过滤一些质量差的页面。
然后根据页面的质量对质量好的页面进行排序,
最后就是我们看到的排名情况
有些人可能会问为什么不包括我的网站
其中一个主要原因是网站页面质量差,被搜索引擎过滤掉了,所以没有被百度收录。
(一)搜索引擎抓取:
1.蜘蛛是一种爬虫,它沿着网页中的超链接在互联网上查找和收集网页信息
2.蜘蛛抓取的方式
1)深度抓取(垂直抓取,先抓取一列的内容页面,再以同样的方式抓取另一列)
2)宽度抓取(水平抓取,先抓取每一栏,再抓取每一栏页面下方的内容页面)
3.不利于蜘蛛识别的内容j
s码、iframe框架码机制、图片(添加alt属性辅助识别)、flash(视频前后添加文字辅助搜索引擎识别)、登录后才能获取的页面信息、嵌套表格等网站结构:首页——栏页面——内容详情页。
(二)搜索引擎过滤
过滤低质量内容页面
什么是低质量的内容页面
1、收藏,内容价值低
2.文本内容不正确
3.没有丰富的内容
(c)搜索引擎存储索引库
在过滤蜘蛛抓取的内容后,内容存储在临时数据索引数据库中。
(4)搜索引擎显示排序
将存储索引库的内容按质量排序,然后调出给用户看。
1.检索器根据用户输入的查询关键词,快速检索索引数据库中的文档,评估文档与查询的相关性,对要输出的结果进行排序,并将查询结果显示给用户反馈。
2.当我们在搜索引擎中只看到一个结果时,搜索按照各种算法排序,质量最好的前十个结果放在第一页
搜索引擎优化的日常注意事项:
1.请勿随意删除或移动包含的页面
2.显示结果需要一定的时间(2个月内正常)
3.内容丰富
4.吸引蜘蛛(主动提交给搜索引擎,外链)
5、蜘蛛追踪,网站iis日志
总结:
1.要想学好seo,首先要有一个好的学习态度
2.不要试图依靠所谓的捷径,比如黑帽,只能达到暂时的效果,却要被永久的惩罚,降权甚至k站(俗称拔毛)
516位用户关注
305位用户关注