网站搬家不止改DNS,这3个谷歌收录操作 | 90%的人会忘,补上后收录翻倍
公司决定换掉位于洛杉矶机房的旧虚拟主机。网管小李在域名服务商后台把解析记录改成了新主机所在的IP地址。这套操作耗时大概10分钟。小李关掉电脑下班。过了整整72小时,公司主打的数控机床产品页在谷歌排名从第2页消失得无影无踪。旧站原本每天能迎来450个海外独立访客。站长统计后台显示现在的日活只有区区8个人,全是公司内部销售员的测试点击。谷歌爬虫拿着旧的寻找路线,彻底找不到新服务器上的对应文件了。
网页是由几百行代码构成的独立个体。搜索引擎按一个个单独的网址来计算信任度。1个服役了4年的老产品页带有很高的历史评分。新服务器上全都是刚生成不到24小时的新文件。访客点开旧网页的书签,屏幕中央会弹出一个硕大的404数字。404代表该文件丢失。48小时内,搜索引擎会把出现404状态码的页面从庞大的索引库里无情剔除。
你需要把旧网站累积的权重原封不动移交给新网页。去服务器控制面板下载一份过去90天的访问日志。把带有真实访客访问记录的网页全部挑出来。在电脑桌面上新建一个电子表格文档。
打开制表软件建立两列完全空白的数据栏
左边一栏粘贴带有旧前缀的老网页地址
右边一栏粘贴新服务器环境下的新地址
把这份包含几千行数据的表格保存为纯文本格式
交给公司的运维人员去写入服务器配置文件
要求技术员强制开启网页的301状态
坚决不用带有302字眼的临时指令代码
一台配置普通的Nginx服务器处理1500条301规则大概只需几毫秒。数字301明确告知爬虫把旧页面的100%打分转移给新页面。旧页面的历史功绩由新页面全盘继承。
爬虫程序按自己的设定路线在互联网上巡逻。让它自己漫无目的在百亿个网页里找你的新网站非常耽误事。官方给出了专用的站长工具后台。
| 后台动作 | 适用情形 | 耗时预估 |
|---|---|---|
| 提交变更通知 | 更改了网站域名 | 5分钟 |
| 上传xml文件 | 页面结构大变动 | 3分钟 |
| 保持旧版权限 | 发生任意搬家行为 | 0分钟 |
控制台界面右上角有个不起眼的齿轮图标。点进去能清晰看到地址更改选项。框里填入新网址,用鼠标点击验证按钮。这等于去官方邮局报备了公司的新住址。网站地图文件里密密麻麻列着3000个产品链接。把带有xml后缀的文件名称贴到提交框里。爬虫顺着地图指引一天能抓取800个新网页。把旧版控制台的管理权限老老实实保留180天。留着旧数据跟新版数据做长达半年的流量比对。
产品详情页里穿插着几百个互相引用的说明文字。点击“查看配套螺丝”这5个字,浏览器跳转的页面依然带着3年前的老域名地址。技术人员敲击键盘写几行SQL代码查数据库。全站查找带有http旧前缀的字符。这台8核16G配置的新服务器花了不到15分钟就全部替换成了https新前缀。
网页里的陈旧死链接会让爬虫在几百个无用的跳转中耗尽今日的免费抓取配额。
不去修改那些旧前缀,爬虫每抓取200个页面就会撞上70个带跳转的旧链接。一天3000次的免费抓取额度就这样被无效跳转白白耗尽。网页的底层源代码里有一串叫canonical的英文字符。它专门负责正版识别。
把鼠标指针移动到页面空白区点击右键
在弹出的菜单里选择查看网页源代码选项
按下键盘Ctrl加F键调出浏览器搜索框
准确输入canonical这九个小写字母查找
仔细检查双引号内包含的具体地址
逐字核对是否全为当下的新版网址
这串不到50个字母的代码专门给爬虫指认哪个页面该被收录进资料库。指错路,新网页永远别想在搜索引擎拿到排名。
旧服务器的网费老老实实拿钱续交半年。这180天留给爬虫程序慢慢消化这20000个网址的历史变动。每天早上到公司花10分钟登录控制台看报错报表。用眼睛重点查阅404错误提示激增的具体数据。某条产品链接的报错量一天突破50次,把它单独复制出来补充一条重定向规则。一栋大楼的整体搬迁带有成千上万个物品的变动。把这3个动作补齐,新站点的收录量会在30天内跑赢旧版。
