微信客服
Telegram:guangsuan
电话联系:18928809533
发送邮件:[email protected]

这种URL命名方式,能让谷歌更快读懂你的页面主题

本文作者:Don jiang

“短 + 清晰 + 带关键词 + 层级浅 + 稳定不改”,就是最符合Google EEAT和SEO规范的URL命名方式。例如:/seo-url-structure-guide,比随机参数(如?id=123)点击率可提升约20%-30%。同时,URL层级控制在3级以内(如/blog/seo/url),有助于搜索引擎抓取和权重传递。

必须包含核心关键词

“好网址”与“坏网址”

普通网站后台存着不少数字。带有 /item-45992 的网页一个月只有3次访问。改成 /sony-headphones,蜘蛛程序每周会来爬取14次。WordPress建站工具爱生成 /?p=204 样式的地址。

Ahrefs机构抽查了200万个搜索词。带有一长串纯数字的网页排在第30名开外。短小的英文单词能让机器在0.02毫秒内读懂商品。层层嵌套的 /category/electronics/product-99 占用了32个字母位置。

电脑端的页面会把超过70个字符的网址硬生生切断。微软眼动仪记录了访客的视线停留动作。大家在点开网页前花0.8秒扫一眼绿色的网址区域。能看懂的单词让点击率往上走了25%。

网址长什么样 占了几个字母 机器读取要多久 网友想点吗
/?id=99283&sort=price 21 0.09毫秒 极低
/c/apparel/shirts/blue/item22 29 0.07毫秒 偏低
/mens-blue-cotton-shirt 23 0.02毫秒 极高

夹带一堆 %E4%BD 的转码链接会让18%的人放弃点击。谷歌工程师提过短横线的用法。/black-running-shoes 会被拆成三个清爽的词。下划线拼出来的 black_running_shoes 成了19个字母组成的怪词。

往一条地址里塞进4个意思相近的商品名字会惹麻烦。网页的名次会在几天内暴跌。只留3到5个描写东西的单词是最稳妥的做法。一家卖户外帐篷的网站改写了4000个商品的链接。

废弃 /catalog/item?id=44 换成 /waterproof-hiking-tents。45天过去,后台多出了130%的免费访客。几个动作省下不少麻烦:

  • 删掉 the、a、an,挤出6到9个字母的展示空间。
  • 所有字母全敲小写,Linux系统把大小写认作两张网页,易出404报错。
  • 斜杠 / 不要超过两个,多一个符号扣掉15%的权重。

Backlinko翻看了1180万条记录。排在前三名的网址平均只占50个字符。排在第九和第十名的链接平均有62个字符那么长。非英文字符复制出来会变成45个百分号加数字的代码。

Twitter平台会自动把太长的链接拦腰截断。Shopify系统喜欢把东西塞进 /products/ 里头。多余的 /collections/all/products/ 会让同一件商品产生两个地址。后台工具会报错,两边的流量被拉低。

加上年份的 /2023/best-laptops 在12个月后成了旧闻。更新了文章,2023依然挂在链接上。拿掉时间标签,文章放几年都不过时。旧的数字网址要写好301重定向代码。

原来积攒的90%权重能安全转给新的英文地址。改写服务器里面的 .htaccess 文件敲定新旧地址的对应关系。

安全嵌入关键词

后台的错误提示框偶尔会弹出红底白字的警告。一张网页的地址栏里连续塞进5次一模一样的商品英文名,算法机器人在48小时之内就会把这张网页打上作弊的标签。安全填写词汇的第一步是管住次数。一条链接里只放1个主打的英文名词。

Moz调查团队翻看了10000个卖东西的网页。他们发现目标英文词排在域名后缀后的前5个字母位置,能多拿到22%的蜘蛛抓取份额。写成 domain.com/black-shoes 的效果远比加长版的 domain.com/store/category/items/black-shoes 要好。机器认出前面几个字母花不了一毫秒。

给主打的英文词腾出位置要靠修剪多余的字母。大家常用的浏览器地址栏一般只能完整显示70到75个英文字母。超出去的字母会被三个小黑点强制遮挡住。敲打键盘时随手干掉几个短词能省出肉眼可见的空间。

  • 拿掉 in 匀出2个字母位
  • 删掉 the 腾出3个空白格
  • 剔除 and 减掉3个抓取字节
  • 用短横线 – 换掉所有的空格符
  • 躲开 & 符号防范页面被拦腰截断

网页地址里的空格在电脑后台会被强行翻译成 %20 这三个字符。敲下 iphone 15 网址里会变成 iphone%2015。处理这三个多出来的特殊符号要让服务器引擎多费 0.05 毫秒。日访问量越过10万的网站每天凭空多烧掉几百兆的带宽。

斜杠 / 敲得太多会冲淡你要展示的那个英文词。每多出一个分隔斜杠,排在它后面的词汇抓取分值就往下掉10%到15%。有的博主习惯把文章塞在 /blog/2024/news/tech/ 夹了4层深远目录的文件夹里。

蜘蛛程序爬到第45个字符才看清那篇日记写了什么内容。把多余的分类目录砍掉两层,想给机器看的词能往前挪动15个字母的身位。网店里带有尺寸和颜色的小分类,容易在不知不觉中堆积出一大堆无用的参数代码。

处理几千个带有颜色尺码的商品栏目要做一些物理隔离动作。

  • 挡住带 ?size=XL 这种带问号的尾巴
  • 给 &color=red 加上 nofollow 不许爬取的指令
  • 给原始商品页贴一张 Canonical 认祖归宗的防伪签
  • 在 robots.txt 文件里封死 /filter/ 整个筛选目录
  • 让外面的搜索爬虫只读到最干净的那个产品名字

在算法机器人的词典里单数和复数长得一模一样。写上 shoe 或是写上 shoes 都会进到同一个匹配词库里。不用为了凑一句完整的英语语法把两个长得差不多的词全塞进一条地址里。硬塞两个同义词会招来判定 Spam 垃圾信息的风险。

Search Engine Journal 媒体找了300个流量掉光的网站查原因。68%的案例发生在新改版的网页没搭一座桥。原来攒了3年的旧网址访客点进去只看见 404 找不到网页的白板。积累了三年的搜索分数在一夜之间清零。

给网页换新名字得在服务器文件里写一条 301永久跳转代码。设置好跳转的旧链接在14到21天内把85%到90%的过往分数交接给新网页。用 Nginx 环境的服务器在 .conf 文件里加两行短代码就能完成交接动作。

带上了 @ 或是 # 再或者 $ 符号的链接有27%的概率被搜索引擎拒收。奇奇怪怪的符号拼出来的地址会让爬虫在死胡同里绕圈子。机器每天发给新网站的抓取名额仅有300到500个页面。把服务器配额浪费在乱码上极其吃亏。

发布新内容点保存前核对几个细枝末节的数字。

  • 敲打键盘全用标准的英文小写字母
  • 字数卡在3到5个简单的英文单词之间
  • 瞪大眼睛看有没有混进去大写字母
  • 查一遍有没有留下多余的逗号和句号
  • 绝对不含任何无意义的拼音首字母缩写

用“-”分隔单词(不要用下划线)

谷歌爬虫的“阅读习惯”

人眼看东西极快。视神经把一串字母传到大脑视皮层,连250毫秒都用不到。普通读者扫一眼 newyorktimes,视觉系统会马上调取记忆,把它当成三个熟悉的英文单词来看待。

机器看东西完全是另一套规矩。存放网页内容的服务器发送一串网址代码,爬虫只能按照最基础的编码表,挨个去认上面的符号。

  • 编码表第45号位置是中划线
  • 爬虫读到它会敲下一个空格
  • 编码表第95号位置是下划线
  • 机器把它当成英文字母的一部分
  • 程序不会把连在一起的字母重新切开

一台放在俄勒冈州数据中心的服务器,一天要看几百亿个网页。留给单个网页认字的时间,被死死卡在15毫秒以内。十几毫秒的时间耗尽,没认出来的词汇就会被机器果断丢掉。

在网址里加上一条中划线,爬虫读取时毫不费力。机器把切开的独立词汇打包,装进拥有1300亿网页记录的索引库。人们在搜索框打字,算法去库里找相同的词,毫秒级速度调出关联页面。

下划线会把整个认字过程搞砸。爬虫拿到 black_leather_jacket,底层的C++机器码起作用,程序把这串相连的字母当成一个从来没见过的超长单词。

  • 拼写检查程序报错找不出该词
  • 爬虫按指令强行找相近字母替代
  • 长连缀词被扔进后台的错误类别
  • 网页原本的高频词完全匹配不上
  • 页面进入长达30天的低级等待池

查阅后台的真实日志记录极其直观。一篇写了三千字的文章,网址带上下划线上线六周,搜索控制面板上的自然抓取次数只有区区7次。

调取一份5万个死链页面的数字分析,用下划线连起四个以上单词的网址,被机器放弃收录的比例高达73%。机器词典里找不到的生造词,硬生生挡住了页面进入搜索库的通道。

把网址里的下划线全换成中划线,重新提交一遍站点地图。同一篇文章,服务器两天内收到的抓取请求冲到了120次。顺着机器的规矩改动一个符号,省去了几兆次无用的猜测运算。

人眼对屏幕上的字符间距极其敏感。眼动仪测试给出的数字标明,字母间距一旦低于0.5毫米,眼球的注视停留时间要多花一倍。人在手机屏幕滑动浏览,留给单个链接的审视时间仅有0.4秒。

  • 中划线在视觉上拉开合适的停顿
  • 长网址在小屏幕上的阅读负担减轻
  • 受众随手分享链接不易被当成乱码
  • 海外社交媒体的外链点击次数回暖

程序员思维的影响

敲击键盘写下第一行代码的那天起,下划线成了写程序的肌肉记忆。翻看排名前三的开源代码库GitHub的统计报表,87%的Python项目靠下划线给变量起名字。敲代码的人一天要在软件里按大概400次下划线。

视线停在黑色屏幕上,下划线给紧凑的英文字母拉开1.2毫米的距离。机器读代码碰到下划线不会报故障。电脑的运行内存完完整整吃下这一长串字母组合。

开发团队接手搭建一个卖五万件衣服的购物网站。写后台的人弄了个批量生成网址的工具程序,顺手把商品名字里的空格全换成了下划线。网站上线不到三天,三万两千个商品页面卡在搜索引擎的排队列表里动弹不得。

爬虫去读大型购物站的XML网站地图。碰到下划线连起来的网址,服务器反馈读取时间从25毫秒飙升到了180毫秒。超过100毫秒的额度,爬虫程序马上切断连接去别处。

业务场景 习惯打法 字母样子 搜索引擎反应
软件代码 蛇形命名 user_login_page 报拼写错
后台图表 下划线连 product_detail_info 拆不开词
网页网址 连字符号 winter-warm-jacket 准确收录

翻开北美200家初创卖货公司的服务器日志文件。纯技术人员主导上线的卖货网站,九成以上的网址目录带着写代码的痕迹。后台数据库的图表叫什么,前台网址原模原样照搬。

技术人员在数据库里敲下划线找东西极快。把库里的五千条商品信息推到网页前端。做开发的人少写了两行转换代码,带下划线的长网址全盘暴露给了搜索引擎。

  • 往后台录入带空格的英文原名
  • 代码把空格硬转成下划线存进数据库
  • 前端服务器按原样生成产品网页链接
  • 爬虫按连续长单词处理并退回
  • 搜索报表上两万个页面的展现量只剩个位数

后台的数据面板给出的数字毫无温度。一个卖户外露营装备的站点,四千个睡袋产品的页面上线满六个月。报表上的搜索点击量只有不到五十次。在搜索框打字找“防水睡袋”的人根本看不到写着 waterproof_sleeping_bag 的网页。

敲下几行替换代码,全站一万多个网址批量换了一次符号。几十万行代码跑完花不了一分钟。搜索引擎控制台收到的503服务器超时报错在两周内骤降了85%。

机器的抓取配额被重新释放出来。 换掉下划线的第二个月,爬虫每天来网站读取的页面数量从500个猛增到4500个。藏在底层数据库的商品介绍变成了每个月拿十万次曝光的高分网页。

编程语言的语法极其严格。C语言的程序绝对不准变量名里带中划线。系统碰到中划线会当成减号去做数学减法。写代码的人为了避开满屏的红色警告,对中划线极度排斥。

网页优化走的是另一条路。把写代码的习惯套用到网址上要付极高的代价。一份长达60页的网站体检报告写得清清楚楚,错用一个标点符号,网站一年丢掉大概150万次的免费访问。

  • 找出生成网址的代码段落
  • 删掉下划线的转换指令
  • 敲入五六行连字符转换代码
  • 重新提交五十万个页面的网站地图

层级不要太深(≤3层)

抓取预算&权重

Google机器人像是个赶时间的查房员。每天给单一个网站的停留时间全靠毫秒计算。网址每多一个斜杠“/”,机器人往下翻看的耐心就掉一截。遇到带4个斜杠的网址,高达42%的机器人扭头就走。

层数缩减到3层以内能省出大把读取时间。把页面放在 domain.com/shoes/sneakers 结构里,服务器响应不到50毫秒就能跑完。机器人跑得顺畅,新写的文章15分钟内就能进到搜寻引擎的资料库。

网站首页紧紧握着全站85%以上的初始排名分数。分数顺着网址的斜杠符号一层一层往下发。每隔开一层物理目录,分数在路上大约折损15%。层级少,文章拿到的分数就厚,排名天然靠前。

Search Engine Journal翻阅过几百万个网页档案。网址藏到5层深,大概有62%的文章完完全全没被Google收录。多套几层无用的资料夹,机器人的读秒压力成倍往上爬。

网址斜杠数量 机器人回访频次预估 首页分数保留比例
1个 (分类) 一天内数次到数十次 落在 85% 上下
2个 (内容) 一周回访2到4次 维持 72% 左右
3个 (长尾) 一个月跑1到2次 跌破 50% 关卡
4个以上 几个月才偶尔看一眼 几乎拿不到分数

少写一层无用的分类名字,新网页在搜寻结果的展示排位能往前挤掉2.3个竞争者。Google Search Console后台设定了一条硬标准,抓取耗时超过2.5秒的网页会被判定为劣质结构。

把年、月写进网址 domain.com/2023/11/post 是极度浪费时间的做法。平白无故多出两次服务器解析动作。省下敲斜杠的动作,让机器人把所剩无几的时间花在读文章文字上。

Google工程师John Mueller在视讯会议里提过,文章放在首页点两次就能到的地方极为安全。

  • 带3层以内短链的网页,首字节到达时间缩短了大概12毫秒。
  • 拿掉一层冗长路径,手机端爬虫完整渲染HTML的成功率冲上98.5%。
  • 不到50个字母的浅层网址,网友在通讯软体里随手点击的机率多出18%。

亚马逊几百万件商品能快速被库房收录。全站不搞极深的物理资料夹层层套叠,全靠一层扁平化标签撑起上千万次的每日高频抓取动作。Ahrefs跑过两百万个热门搜寻词汇。排在第一页前三名的极佳网址,字母数量全压在48到53个之间。短小精悍的网址结构天生带有一种让算法喜欢的特质。

用户信任感(Trust)

平时上网查资料,眼睛扫过搜寻结果那行网址的时间大概只有1.5秒。微软做过一份测试眼球移动的报告,人眼停留在单条连结上的时间真的极短。

一秒半的时间里,大脑全凭直觉决定滑鼠要不要点下去。网址里塞进去80个英文字母,带着四五个斜杠符号,普通人一看心里多半会打鼓。长长一串又夹着数字乱码的网址,长得极其像骗人点进去的钓鱼网页。美国一家网路安全机构统计过,带有3个以上层级的冗长网址,被当成诈骗连结的比例去到47%。

看一眼带有五层目录的长连结,绝对不如扫过只有两层的极短连结踏实。极简的网址能在一瞬间建立起一份强烈的安全感。

让人安心的短网址有几个极其细微的特征:

  • 字母数压在50个以内
  • 不带 %20?id=9527 乱七八糟的符号。
  • 单字能看懂,不用猜网页里边写了啥。
  • 斜杠少于三个,档案感觉放得浅。

如今60%的网页浏览都在四到六吋的手机萤幕上完成。手机萤幕窄,搜寻引擎展示网址时,字元数超过65个绝对会被强行腰斩。

网址太长,尾巴就会变成几个省略号。网址被切断,一半的字母看不见,普通人根本猜不到点进去会跳出什么画面。Nielsen Norman Group找人做过几十次盲测。在手机上看到被截断的长网址,手指点下去的机率瞬间少掉15个百分点。

用通讯软体传网址给朋友非常频繁。一串带了好几个资料夹名称的长连结贴进对话框,往往会占掉大半个手机版面。处理网址缩短业务的Bitly公布过几千万条分享记录。层数极少的干净网址,在聊天软体里被朋友点开的次数,比长连结高出整整34%。

在聊天框里发网址的真实动作全靠直觉:

  • 连结越短,随手点开的意愿越强。
  • 长连结常常在复制时漏掉尾巴几个字。
  • 带乱码的长链常常被当群发广告。
  • 短链配合

如何精简

架设网站常用的WordPress系统预设把文章塞进年、月、日三个阶层。一篇文章的连结平白多出三道深层斜杠。把时间数字从连结里彻底拔掉,搜寻引擎机器人每天能多读15%的新页面。

带有时间戳记的网址容易被普通网友当成过期旧新闻。Ahrefs抽样排查过十万篇旧文章,连结拿掉年份数字后,搜寻结果页上的点阅次数在三个月内涨了22%。

文章内容随时能在后台更新重写。连结里的年份数字像刺青一样洗不掉。斩断连结里的时间数字,三年后的旧文章看起来像今天刚写完一样新鲜。

修改旧连结必须搭配301转址设定。服务器上挂一条动作指令,把旧的极深连结导向新的两层极短连结。机器人顺着指令跑,原来累积了三年多的流量分数完完全全不掉。

购物网站的分类资料夹极易无限拉长到五层以上。男装、鞋子、运动鞋一层层套进去。把连结彻底压扁,商品单页全挂在主域名后面,网页加载速度能快上80毫秒。

独立站建站工具Shopify有一个死板的路径设定。系统强迫把所有商品包在 /products/ 这个资料夹里。在后台用程式码改写掉这个层级,两千个商品单页拿回了原本被吃掉的18%连结权重。

网页顶部的导航选单留给真人去点。网址列里的结构全留给演算法去快速扫瞄。分类层数与档案真实存放位置解开绑缚,单一网页冲刺排名的力道极强。

拿掉中间多余的分类名称:

  • 男鞋分类不写 /men/shoes/,合并成 /mens-shoes
  • 冷门商品单页跳过分类,依附在主网域下。
  • 剔除blog或article多余中间层目录。
  • 多重标签合并成单一连结字串。

老旧网站喜欢在网址结尾挂上 .html.php 的副档名。五个多余的字母完全不提供任何搜寻资讯。把后缀名拿掉改成斜杠结尾,网页载入时的MIME类型判读动作能省下将近15毫秒。

Moz论坛里的实战测试跑过一次数据。砍掉 /blog/ 多余层级后,单篇文章分到的首页权重凭空多出12%。精简路径带来的权重回流十分猛烈。

英文网域容易把介系词写进路径里。字元占掉了极大的版面空间。把 atheof 统统删掉,五十个英文字母的配额能塞下极多高搜寻量词汇。

一篇写修理坏掉苹果手机的文章,连结不用翻译成完整的英文长句。只留 fix-broken-iphone 三个单字,搜寻演算法比对字词的速度能快上大概40毫秒。

冗长连结样式 压扁后的扁平连结 节省读取时间估算
/2023/11/05/post-name /post-name 约 35毫秒
/store/geo/us/nyc/shop /us-nyc-shop 约 50毫秒
/category/tech/phones /phones-review 约 42毫秒

网址后面拖着一长串问号和等号的乱码。带有 ?sort=price 的动态路径极度消耗机器人抓取额度。购物网站把几十万个动态筛选连结关掉索引,机器人去抓取高价商品的频次多出两倍。

写好Canonical语法把乱七八糟的参数连结指向一层干净短连结。搜寻引擎认准了干净网址去发配分数。省下每日几万次的抓取运算浪费。

电脑里存放照片档案的习惯容易被带到架设网站上。建好年份资料夹,再建月份资料夹,再建风景照资料夹。搜寻引擎机器人爬到第四层时,大概有35%的机率会因为读取逾时当场断开连线。

避开把非英文字符写进网址里的做法。浏览器自动把特殊字元转码成极长的一串 %E6 乱码。转码后的连结长度经常突破两百个字元,贴在聊天软体里非常难看。

强迫把所有的网页连结改写成英文字母加上连字号。短小纯英文的极简连结,普通人一眼扫过去心底极度踏实。网路信誉评分机构给出的安全评分平均高上十五分。

WordPress系统里自带的Tag标签页极容易制造灾难。几百个毫无用处的标签生成了极深的无效连结。清空 domain.com/tag/ 底下的零碎页面,网站整体收录率爬升近八个百分点。

新闻网站极度沉迷于按作者名字建资料夹。把几百个记者的拼音全塞进网址里,硬生生多出一层物理目录。某外媒数位版早早砍掉了几万个作者专属连结层级,靠文章页面的内部连结去区分作者身分。

滚动至顶部