《seo优化意思》抓取的网站如何做seo

  • A+
所属分类:黑帽技巧
摘要

?企业在网站建设时,可以这样说很多同时也做了手机端的网站,为了丰富网站的版面和内容,给网站添加了大量的图片做美化。网站的图片是一个网站能给用户最直观的信息表现,而对于搜索引擎而言,蜘蛛在随机抓取网站图片时候的识别

?

企业在网站建设时,可以这样说很多同时也做了手机端的网站,为了丰富网站的版面和内容,给网站添加了大量的图片做美化。网站的图片是一个网站能给用户最直观的信息表现,而对于搜索引擎而言,蜘蛛在随机抓取网站图片时候的识别能力还没有那么强。如果文字很少,图片很多也会给手机端网站SEO优化带来一定的困难。

估计这样会效果可以不过,随着搜索引擎算法的不断成熟,现在百度也能抓取网站的图片,例如:网站的LOGO、以及和文章主题相关的图片等等。十堰网站建设公司SEO优化顾问经过长时间的观察,总结出了以下六种方法,协助我们优化网站和手机端的图片,以达到优化友好,迅速被录入的作用。

在平时工作的时候,基本上了把发现和自己网站相关的图片可以先保存下来,在本地做出分类和标记。网站需要图片的时候,看看相关的图片,自己着手做一个图片。这是一个长期积累的过程,随之时间的增加,自己的素材量也会越来越大。熟练了再做图片就得心应手了。

可以这样说这个问题很多站长都没有注意,图片在传到到网站的时候,尽量把图片保存在一个目录下面,或者根据网站栏目做好相应的图片目录,上传的时候路径要相对固定,方便蜘蛛抓取,蜘蛛在访问到这个目录的时候就会“知道”这个目录里面保存的是图片

图片文件命名最好使用一些有规律的或者意义的方法,可以使用时间、栏目名称或者网站名称来命名。例如:SEO优化下面的图片可以使用“SEOYH2018-6-29-96”这种命名,一直都这样想前面“SEOYH”是SEO优化的简拼,中间是时间,最后是图片的ID。

文章的开头就说了,网站图片是能把信息直接呈现给用户一个方法,通常来讲搜索引擎在抓取网站内容的时候,也会检测这篇文章是否有配图、视频或者表格等等,这些都是可以增加文章分数值的元素,其他的几个形式暂时不表,这里我们只说说关于图片周围相关文字的介绍。

首先图片周边文字要与图片本身内容相符,可以这样说例如你的文章说的是做网站优化,里面配图是一道菜谱的图片,这不是挂羊头卖狗肉么?用户的访问感会极差,搜索引擎通过相关算法识别这张图片以后,也会觉得图文不符,给你差评哦。

还有就是这两个属性,大致来讲会给有阅读障碍的访问者提供访问的便利,例如:有盲人在访问你网站的时候,他看不到屏幕上的内容,可能是通过读屏软件来阅读的,如果有alt属性,软件会直接读出alt属性里的文字,给他们的访问提供方便。

网站的上的图片,一直以来都提倡用尽量小的图片,通常来讲去最大化呈现内容。为什么要这样呢?因为小尺寸的图片会加载的更快,不会让访问者等待太久,特别是手机访问的时候,由于手机上网速度和流量的限制,用户更愿意访问能立即打开的页面,小尺寸图片就更有优势了。

估计可以这样在这里我们尽量做好平衡ˋ,在图片不失真的情况下,尺寸最好尽量的小。现在有很多在线给图片瘦身的工具,各位站长可以去尝试一下,把网站的图片适当的压缩一下,一方面可以减少你服务器带宽的压力,另外还能给用户有流畅的体验。

公司使用angularJs(以下都是指ng1)框架做了互联网应用┮,之前没接触过seo,突然一天运营那边传来任务:要给网站做搜索引擎优化,需要研发支持。搜了下发现单页面应用做seo比较费劲,国内相关实践资料分享出来的也比较少,略懵,前后花了一番功夫总算完成了。在这里记录下来,做一个总结,差不多可以也希望能够帮助在做类似工作的朋友少走一点弯路。还是建议需要seo的网站技术选型尽量不要使用angularreact一类的单页面框架。如果你和我一样网站做完了发现需要seo,那么往下看吧。如果各位已有更优的方案欢迎拍砖交流。

做seo必须了解爬虫工作的基本原理。搜索引擎能够搜到一个网页是因为对其做了索引,而在这之前需要爬虫抓取到网站页面存储为一个快照,快照的内容即页面的静态内容。一般来说,右键查看网页源代码看到的内容即爬虫所能抓取到的内容。爬虫拿到一个url后抓取其页面信息,查找页面中的a标签╥,差不多会比较好拿到下一个url跳转地址,继续下一个页面抓取。seo的工作目的是增加搜索引擎对网站的索引量以及提升网页排名,传统的seo工作例如站内tdk的优化、网站url优化、外链增加都是为了达到这些目的。做到这些有一个共同的前提,就是网页内容能够被搜索引擎抓取到,而单页面应用seo的困难就卡在这里。

angular实现单页面的方案是利用了路由机制配合模板引擎。通过自定义模板,一个应用只有一个主页面,通过路由切换不同的状态,嵌套对应的模板引擎。而模板中的动态数据,基本上了把都是通过ajax请求从后端拿到的。这从路由跳转到渲染出完整页面的过程,除了主页面基本的静态数据,其他的全靠js来完成。

可抓取方案放到下面,那样说也对先说说url优化。用过angularjs的都知道,ng的url是靠#来标识一个状态。含#类似符号的url对于seo是非常不友好的,而且据同事反应(本人没有验证),搜索引擎在访问url的时候并不会带着#后的内容去访问。总之,url优化是单页面应用seo绕不开的一个工作,而我们的目的,是把url优化成如同www.xxx.com/111/222/999目录结构的url,它是爬虫最喜欢的形态。

差不多会比较好简单来说,去除#只需要在路由中配置$locationProvider.html5Mode(true)开启html5模式,url会自动去除#以及.html后缀达到最优。但这时存在问题:f5刷新会404找不到页面,原因是f5会把url提交到后端获取资源,而html5模式优化后的url在后端并不存在这样一个资源,直接访问这个链接会连主页面都找不到,自然就会404。以上链接给出的方案是nodejs后端的方案,我们的方案是用springMVC后端,不过原理都是类似的:后端不认识这个链接,我们就把这个错误的连接重定向到原本带#的连接,对于后端来说就是一个正常的访问,而url中的#在浏览器端会再次被html5模式给去除。

重定向的工作可以放在后端springMVC的过滤器中解决,也可以在容器中解决。我们的框架是后端用nginx做负载均衡,我将重定向放在nginx.conf中,通常可以这样说对每个路由状态的url都做了对应的原始url重定向,问题解决。无论如何刷新、访问,页面都是简单舒适的目录结构url。

url优化之后,继续往下看。说白了我们要做的就是单页面应用的可抓取方案,即:如何让搜索引擎能够获取到完整内容的页面信息。我调研了现有的一些解决方案,思路都是类似的。搜索引擎不执行js,估计可以这样我们改变不了抓取的网站如何做seo,那么我们只有像照顾婴儿一样,自己将js执行抓取的网站如何做seo,拿到模板以及动态数据渲染出一个完全静态的页面抓取的网站如何做seo,交给爬虫。我调研过git上的两个方案,做一个分享,如果大家有更好的方案也欢迎分享。  

总的来说,单页面应用可抓取的最大问题就在于搜索引擎不执行js,解决方案无非就是我们自己做动态数据渲染然后喂给爬虫。确定了这些,即使自己去完成这样一个框架也不是一件困难的事了。

?以上就是关于《抓取的网站如何做seo》的详细讲解,本文由轩辕SEO培训收集于网络不代表本站观点,如果您还想了解seo详细内容以及项目合作,请直接联系轩辕qq或微信。

  • 我的微信
  • 这是我的微信扫一扫
  • weinxin
  • 我的微信公众号
  • 我的微信公众号扫一扫
  • weinxin

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: