登陆注册
11597400000004

第4章 长尾词

主笔 葛维樱

24小时随时可以下单购物,这是我们当下的消费新景。可是,海量的物与人,你如何找到你要的那款物件?或者说,卖家又如何迅速识别你的需求?

你冥思苦想认为足以把想要之物描述清楚的词汇之中,有一个不那么显眼却至关重要的词叫作“长尾词”。这是网络消费的关键。

简单讲,在网络世界里,卖家与买家都在茫茫人海里寻找彼此,如何找到对方?在搜索里,你用一个特别显眼的词当然会吸引眼球,比如“连衣裙”,但结果大家发觉,“连衣裙”搜出了1900万个结果。如何在如此庞大的数据里选择?这是不可能的任务。可以,如果你为这个词加上“尾巴”——“夏天连衣裙文艺复古”,结果大为缩小,只有4000多个答案。所以,你的“尾巴”越丰富,你寻找到需要的物件的可能性越大。

一个行业说法是,一件物品的关键词库至少有500个。因而,对于卖家来说,你得随时更新和有效变换,导致找出能卖掉货物的词,这是卖家的长尾制胜法宝。微小市场累积起来就会占据市场中可观的份额——这就是长尾的思想。这其间的巧妙就是,在热词与热词的衍生物之间,你的选择不是前者而是后者。比如,一件不怎么样的商品用了竞争力很大的热词“韩版”,那么引擎搜到它之后,会被毫不留情地排除掉。但如果使用一个会和最热的词产生关联的“长尾词”,比如“韩国优雅奢华代购”,那么这件商品就很有可能变成一笔成功的交易。

所谓“长尾词”,它是关键词选词矩阵SEM(结构方程模型)的术语,也就是搜索引擎营销的方法论。它有两个特点:细和长。细,说明是份额很少的市场,甚至是不被重视的市场;长,说明这些市场虽小,但数量众多。一旦找到,好像得到一把开启大门的钥匙,就能进入一个消费的隐秘花园。使用一个长尾词来描述商品,是在基本属性之外,缩小集中、优化搜索结果。

真正指引我们购买的咒语是什么呢?长尾词类似买家和卖家在互相破招。中心关键字通常很难把一个商品送上主页,即便能做到,也不会安稳,容易被其他货品挤下去,需要投入很多的人力物力去保护。所有的商家都希望第一时间出现在你搜索栏的结果中?不,答案绝没有这么简单。数据表明,前六页搜索结果购买率并不高。阿里巴巴DT战略的第一步,是要在全球最大的电商公司中,实践“数据化运营”。事实上淘宝首页和引导频道的不断变化和推陈出新,全部都是大数据运算的结果。“天猫‘双十一’,你看到的一切,几乎都是由算法决定的。”天猫数据挖掘专家李博介绍,哪些商品能进入“双十一”,出现在哪些用户的页面和什么位置,都有算法在背后支撑。这就像一场游戏,数据是变量,算法就是游戏规则,设定什么样的游戏规则,将决定游戏最终的结果。

这个算法是长尾词背后的大数据支撑。长尾词看起来非常难以捉摸,可能是淘宝主推的,即将火爆,也可能是有意打击竞争对手做出来的,更有可能只是商家心血来潮的一时灵感,关键在于只要有卖点,任何词都可以成为“热词”。针对长尾词现在已经出现了非常多的“采集器”软件,教卖家用软件来挖掘真正根据网站变化的长尾词,最终得以挤上搜索排序前列位置,并且转化为真正的消费。

长尾词指向的排序结果和购买成功率,乍一看是个语文问题,实际上是一个数学问题。“阿基米德排序”是2010年7月8日上线的淘宝搜索结果排序方法。当时淘宝把“店铺服务质量”作为重要因素加入到搜索中来影响排序,在消保优先、相关性、橱窗推荐的三大前提下,在一定时间范围内,按照店铺服务质量权重排序。具体参数包括:是否违规、是否作弊、退款率、超时退款率、发货速度、响应速度、滞销商品率……参数有几十个,只是权重不一样。

引擎由两名斯坦福大学理学博士拉里·佩奇和谢尔盖·布林发明于1996年。不再像往日抄写符号代码地址,而是以“最相关”来直接告诉你答案。这个“最相关”,在消费数据里远远比网络世界容易实现。“谷歌和百度没能完成的,可能会由淘宝引擎来完成。”卖家最害怕的一个词是“跳出率”,就是好容易用长尾词吸引进来的客人,都可能冷酷无情地走掉。数学是神奇的,程序算法会把客人鼠标停留时间短的商家降低排名,这就叫“跳出率”。一名没找到猎物的猎人绝不会游荡。智能手机让消费者拥有“秒关”的任性,整个互联网移动化时间比预期提前了5年。

在非购物类页面里,引擎只是把搜索页面里的关键字售卖给广告主。而一大排长尾词的用意在于告诉搜索引擎,“我有什么,快来搜我”。长尾词部署的理想状态,是每个页面都能非常快速地被搜索引擎承认,当长尾词得到排名提升的时候,每个具备长尾词的页面都会成为流量的引入入口,使每个页面都发挥其作用。一个具体页面长尾关键词部署三个之内,如果能根据长尾关键词以扩展编辑,这是最好的表现形式。

无限制的长尾词,对于消费者实际上给搜索提供了最大限度的可选择自由。网络消费的决胜之处其实不在于技术实力,而在于用户的需求是否真实,数据是否足够大。2014年11月6日阿里巴巴宣布,其大数据团队自研的实时数据计算平台Galaxy,目前每秒可运算数据超过500万条,预计“双十一”当天每秒运算量将超过1000万条,日处理消息数将超过1万亿条。针对每一笔交易数据,系统将实时反复检测70余次以保证数据质量。

自由的另一点不确定性有趣之处在于,网购时没有人知道你要买什么。我们在网购时可以按照地域(这决定了你的收货速度、运费,但也限制了你的搜索范围)、天猫(这决定了你是否需要品牌)、全球购(是否走海外代购渠道)、价格排序(特定商品很有效果,因为价格真的相差甚远)等条件筛选结果。在“热点”里,还会有非常多的标签式的词语出现,“小香风”“学院风”这些词仿佛魔咒一般,我们甚至可以只写“设计师款”而不写到底买什么,来试试搜出来的外套、椅子、钟表和暖水壶哪个更吸引人。

数据和算法推演导致长尾词和它的目标永远都在变化。搜索引擎带给我们的消费品页面从来没有一致过。试试用同一台电脑,换着用自己的账号和别人的账号登录,再试试用同一账号,在PC、iPad和智能手机上登录。搜索网页目前引擎只能得到关于你所在地域的信息,但在一个电商购物平台里,你买故你在。“以往是淘宝制定排序规则,告诉卖家应该怎样做。在做了个性化排序之后,是卖家告诉淘宝网自己的用户特点,淘宝网就会将相应的消费者通过搜索平台匹配给卖家。”很明显你是一个上午10点到12点在办公室打开网购登录页面,下午17点到18点在交通工具上用手机登录,晚上23点左右又要用iPad登录的人。为什么9元包邮的体恤不会推荐给“高富帅”,过季的打折连衣裙也不会推荐给“白富美”,这是网络在“长尾词”之后,一个平台的整体性进步,即引擎会根据消费者的历史购物行为,学习和理解每个消费者的偏好,同时将“猜你喜欢”推荐给你。

李博表示,“双十一”当天的购物行为高度集中,如果每一个消费者看到的页面和推荐商品都一样,事实上将会压抑大量长尾的消费需求。要想让每个人看到的“双十一”都不一样,大数据就必须了解每个消费者喜好的商品的属性。

这个规则叫作搜索的“维度”。基于大数据的个性化搜索正在不断变换规则和复杂化。个性化排序并不是一个全新的排序方式,而是在以往“阿基米德排序”的基础上引入了个性化的维度。“现在搜索的考核权重包括相关性、下架时间、市场规则、卖家质量、商品质量、人气分、反作弊、个性化,与之前相比,只是多了个性化这个权重因素。”淘宝搜索产品“小二”说,动态评分对于搜索有很大的影响,下架时间在默认排序中的权重依然非常高。

“维度”包括性别、购买力、卖场、卖家规模、店铺、商品标签和品牌。搜索引擎带着所有联动的网站,正在不断优化,实现比人强大得多的信息收集能力。“未来还会不断增加新的维度,逐渐丰富对用户喜好的刻画。”

商品排序的后台人工干涉程度在下降,算法推演和随机性在上升。广告费可以购买直通车进入首页,但是实现销售依然不那么容易。拿“羽绒服”这个关键词来说,会在一段时间内从很小的基数,突然增加到很大的搜索量,可能这段时间天气变冷,购物网站把这个词变成主推词了。这一方面是消费者的需要,更重要的是网站和商家早就已经作好了各种准备。主推词会在存活时间上有特别的限定。可是这么激烈竞争的环境下,想要脱颖而出实现销售,不再是“爆款”的世界。一个好的网络电商平台的首页橱窗制作,比一本时尚杂志花费更多,要赏心悦目又紧跟潮流,浪费流量给一些“月销万件”的某一个廉价热销品的时代将一去不复返。

让有特色的店铺找到你这位特别严苛、审美特别挑剔的客人,这就是引擎带来的“主动”。引擎的个性化做得越细,对商品的要求也就越细,“小而美”的店铺有更多机会。为什么你总是买得过于宽松且色差也大,而她拥有精致的肩线和恰到好处的颜色配比?引擎是个非常善于讨巧的两面派,一方面它衡量买家,另一方面通过对商户的重要性作出客观评价,不断更新搜索结果。当然广告和访问量都很重要,但是访问量属于会被“刷”出来的门槛最低的技术手段,卖家可以购买流量作“直通车”。网络当然不完美,很多商户通过网络数据找到漏洞的方法,电商培训课是“教你14天上首页”之类,还有7天螺旋和14天螺旋的商业操作模型。但所有奥秘的终极指向还是,“产品质量才能真正实现盈利”。

2014年3月,阿里巴巴举办了首届大数据竞赛。第二赛季的优胜者实战参与天猫“双十一”的算法设计。他们是6个“90后”学生组成的团队。天猫将当天会场流量的10%到30%分配给学生团队,天猫自己的算法团队也用同样的流量进行算法比赛,如果学生团队胜出,那么他们6人将共同获得100万元比赛奖金。竞赛吸引了来自全球的7276支队伍共1万多人参赛,并在第二赛季开放了5.7亿条脱敏数据。这是中国网络里数据最丰富、维度最广的平台。数据足够大且规则一直在改变的情况下,事情变得更有趣了。

数据演算正在尽可能地把各种标着代购、设计、小众的衣服和搭配包包、模特示范穿着的商品排序给你。因为最近你搜一件羊绒大衣时,引擎后面已经有一双看不见的眼睛将你定位成经常浏览代购、喜欢小众店铺、价格区间偏高、退货率约等于没有、特别爱给好评甚至爱秀照片的买家了。

往年的“双十一”,哪些商品能够进入天猫“双十一”的会场,是由淘宝人工决定的。商家报给天猫运营“小二”10款畅销商品,“小二”再进行人工挑选。2014年引入大数据算法后,系统根据报名商品的过往销售量、细分行业趋势、消费者需求,来判断这些商品是不是最有热销潜质的款式。

为了实现更精准的推荐,大数据记录的商品标签越来越细致,长尾词越来愈多。以前搜索一双耐克球鞋,只会匹配两个标签,但今年就会细致到一双蓝色的36码耐克球鞋,价格、功能、面料、配色都会被打上标签。通过大数据人物画像,一个成熟的网购用户背后可能有上万个喜好标签,包括喜欢穿休闲裤还是牛仔裤,喜欢喝茶还是咖啡,喜欢豆豆鞋还是运动鞋。“给它一堆商品,和一群人,大数据就能判断出谁更喜欢哪个商品,匹配度是多少。”文本识别引擎将关键词过滤升级为语法语义分析,同时引入机器学习算法,取代了人工搜索和经验判断。在此基础上建立起来的信息排查平台,对全网10亿级的商品数据进行全量检索和处置,支持多达60个维度的组合条件筛选,每天消息处理量2亿以上。

担心自己看不到其他新鲜的商品?担心自己被定型成一个无趣的人?谁也不愿意社交网路被一些推送垃圾广告信息的店铺占领。“推送”的好感度在广告中排列最低,人们依然喜爱的是橱窗。算法和交互设计上当然首先考虑了这个问题,所以被网购平台捧红的偶像层出不穷,“切糕王子”的2015限量版切糕才能几小时立刻售罄,这可是一个长红不衰的网络小店,你能想象有多少人从此真正喜欢上了切糕这种食物吗?

网购平台提供开发工具意味着鼓励小前端自己创造,如果大平台只创造市场,让小前端来分抢现成大单,让成本领先者往往从中受益,导致趋同,就会让网购生态系统倒退。从苹果经验中就可以看出,开发工具水平的高低,往往直接决定多样性水平的高低。而那些你反复看又靠谱的商家,即使广告费少也会被网站排到前面。而给你推荐的各色稀奇古怪的店铺,不管是卖二手日本海报,还是一些完全没销量的代购北欧的盘盘碗碗,5个小时就会被放进大数据重新洗牌一次,然后你又会看到一个全然不同的新的消费世界。

同类推荐
  • 我只是你树上的一只蝉

    我只是你树上的一只蝉

    本书主要内容包括:《斗智》、《山羊当了村官》、《猴子取经》、《谁去陪酒》、《精神的孔开在哪里》、《公章》、《在梦里怎样打败外星人》、《删除贪欲》、《色诱》等。
  • 小镇边缘的黑暗

    小镇边缘的黑暗

    劳拉·卡蒂诺手持9毫米口径的手枪,穿梭于僻静的小镇,调查凶案,追击嫌犯,为被害人主持公道。过去孩子们都在户外肆意玩耍,到天黑才回家,如今他们沉迷于智能手机和社交媒体。虚拟世界更加自由,也更加危险。移动设备是进入孩子生活的密道,易被别有用心之人所利用。这就是pgsk.com Black获得达芙妮·莫里哀奖提名的惊悚小说《小镇边缘的黑暗》所传达的信息。14岁女孩的尸体在小镇公园被发现。嫌犯狡猾、老到、无迹可寻。
  • 解密(入选企鹅经典)

    解密(入选企鹅经典)

    人世间大多的秘密都藏在梦里,就像无法掌控自己的命运,活着却如同没有名字的存在。《解密》是一个天才与另一个天才之间的博弈,是将心灵粉碎再重铸。一个身世多舛的数学天才容金珍,一个类似数学家约翰纳什般的天才人物,因为非凡的才华被招募至国家秘密单位701,破解一部极其困难的敌国密码“紫密”。在巨大的期待和精神危机之下,总是醉心于同疯子下棋、恍若身在梦境的容金珍,是否能够破解“紫密”,成为国家的英雄?在巨大的国家机器中,个人命运沉沉浮浮。若干年后,每个人都只剩下一个关于他们的传说,而谁也无法预测命运的轨迹……
  • 余罪2:我的刑侦笔记

    余罪2:我的刑侦笔记

    本书为您揭开的是一张令人触目惊心的当下社会犯罪网络。从混迹人群中的扒手,到躲在深山老林里的悍匪,从横行街头的流氓,到逡巡在海岸线边缘的毒枭;他们似乎离我们很远,似乎又很近,看似悄无声息,却又如影随形;作者所描写的,正是这个光怪陆离而又真实存在的地下世界。
  • 晚节

    晚节

    除了老秦,病房里什么都是白的:墙壁、天花板、分列两边的窗帘、可升降的病床、源源不断往外冒热的暖气片。就连邻床那名妇女,也白白胖胖的,像条养尊处优的熟蚕。床单和被罩更是洁白如雪,被子也轻暖舒适,相比之下,家里那床被褥简直就是一坨肮脏生锈的铁。老秦穿着黑棉袄,忐忑地窝在雪白的病床上,感觉自己就像老狗钻进了棉花堆,享受着不该享受的待遇,随时可能被人踢一脚然后赶出去。透过干净的窗玻璃,他看到病房楼外园圃里的竹子和棕榈树在狂乱地摇摆,北风嘶吼的声音清晰可闻。外头应该很冷啊。老秦想起了家。
热门推荐
  • 爱人请回答

    爱人请回答

    故事以MH370事件为背景,讲述了一段短暂的却影响男女主人公一生的初恋故事,然而“山盟虽在,锦书难托”。二十年前,一对年轻男女(萧山盟与云锦书)坠入爱河却遭锦书闺蜜横刀夺爱及山盟母亲棒打鸳鸯,山盟与锦书闺蜜结婚生子,锦书远走他乡;二十年后,这对曾是初恋情人的中年男女在吉隆坡机场偶然重逢。压在心底多年的困惑在等机过程中娓娓道来,真相终于大白,而那依然如初恋般炽热的情感在短短的深情对望中重燃,他们终于可以有机会再次走入爱情之中了。
  • 唐国史补

    唐国史补

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。汇聚授权电子版权。
  • 雄关要塞:函谷关(文化之美)

    雄关要塞:函谷关(文化之美)

    函谷关作为我国一个著名的关隘,它坚固险要而又位置重要,这使它成为兵家必争之地;老子在函谷关写《道德经》,这使函谷关成为了道家之源。其是我国最古老、最重要的关塞之一,在这里,曾经发生过许多故事。因此,函谷关成为了我国的一个著名旅游景区, 更成为河南灵宝市的一块金字招牌。
  • 愚者空间

    愚者空间

    一个本该在车祸中死去的青年,为何死而复生?这是主神的游戏还是人为的阴谋?愚者空间,无所不能。
  • 星光不及一个你

    星光不及一个你

    第一次见到他,18岁的他是偶像歌手,16岁的她是乐坛小透明,他的眼睛里有星光。时隔两年,20岁的他被全网黑,远赴异国求学,她是他的同学,他的生活被重新点亮。他清冷而温柔,她温暖而体贴。可惜爱哭的孩子才有糖吃。这就是两个照顾别人但从不被照顾的人互相照顾,温暖彼此的故事。
  • 师傅,门下有徒初长成

    师傅,门下有徒初长成

    前生黑帮千金之躯,双二年华被自己的父亲作为交换领地的筹码,新婚之夜被自己的夫君嫌弃,母亲亲手把自己推进大浪中,绝望到自散魂魄。不巧一朝穿越到五岁女童身,遇到谪仙的他,遇到妖孽的他,谁才是她这一生的良人?她的身世究竟有何惊天的秘密?当爱情遇到家国天下,是如何抉择?只愿一朝与你天涯乐马.....
  • 欢乐颂与沉思颂

    欢乐颂与沉思颂

    《欢乐颂与沉思颂》是英国诗人弥尔顿早年的两首杰作,表达对生活积极的态度和深沉的爱恋、对人生诸世相透彻的思考,倾注了诗人对于自然景象满腔的挚爱,显示了人文主义的立场和观点,对英国后代诗人特别是浪漫派诗人产生了深远影响。《欢乐颂与沉思颂》的译者是我国著名翻译家赵瑞蕻先生,这是他毕生珍爱的译作之一,在他去世之后由译林出版社整理出版。弥尔顿,英国诗人17世纪的伟大诗人、政治家和思想家,反对封建礼教和宗教改革的战士。弥尔顿是清教徒文学的代表,他的一生都在为资产阶级民主运动而奋斗,代表作《失乐园》是和《荷马史诗》、《神曲》并称为西方三大诗歌。
  • 妖孽之异世重生

    妖孽之异世重生

    宇宙之始本无天地,万物皆虚。混沌中有一先天元灵藐看苍穹,利用无上法器开天辟地,己身却灵死道消,仅留下一滴血脉……一名默默无闻的大二学生,因为千年遁世轮回,梦中解禁了远古封印,由此改变了他对世界的认知,也改变了他的人生轨迹……
  • 百草良方(家庭健康生活)

    百草良方(家庭健康生活)

    本书汇集《本草纲目》养生之智慧精粹,是您健康生活的必备之书,使您一书在手,百病不愁!
  • 伐天仙尊

    伐天仙尊

    人生苦,苦为求不得,苦为舍不得,苦为放不下,苦为弃不失,苦为别离,苦为生,苦为死。手掌修仙大陆又如何,修为通天又如何,天道之主又如何,不如换一世平凡,一生安乐,家人陪伴。尝尽人家疾苦,受尽人世繁华,最后不过孤苦一人,剑指苍穹,灭大道逆天改命,看他能否逆乱苍穹,斩人间疾苦。