对于任何企业来讲,特别是传统企业,建设一个体系化的标签库是风险性很高的事情,你会发现不仅建设难度高,而且建了还没人用。
先来讲讲什么是标签,其实就是大家耳熟能详的信息分类和标记机制,标签和分类的区别是大家喜闻乐见的,但是不够深度和震撼,我们深入一点点。
标签是扁平的,分类是层级的
标签是精确的,分类是粗糙的
标签是多维的,分类是一维的
事实上,在数据领域,有一个鼎鼎大名的词汇与标签极其雷同,无论它的定义、它的适用范围,还是它的衍生应用都与标签令人惊讶的一致,它就是:元数据。
元数据:用来描述数据的数据,是从数据中抽取出来用于说明其特征的数据,是结构化数据。
可是和我们要讲的标签有什么关系呢?别急,如果把元数据的定义替换为标签,我们就能看到一个令人兴奋的进化:标签,用来描述信息的数据,是从信息中抽取出来用于说明其特征的数据,是结构化数据。
很贴切、很精确、很完美的标签定义,不是吗?
回到开头说的,为什么企业建设体系化的标签库很难?
大数据给了我一个机会,一个独特的视角,这里就来谈一谈。
1、战略:不需要数据驱动业务
企业如果仍然处于野蛮增长阶段,或者数字化服务没有达到一定的阶段,数据驱动业务的迫切性其实并不强,这个时候不需要标签库,一般的数据需求搞个数据库取取数就够了,这个跟你的企业大小无关,数据大小无关,却跟你企业所处的阶段有关,当然对于传统企业来讲,还跟一把手有关。
这个是从面的角度考虑问题,没有企业的基本面,你几乎没有机会去做一个真正的标签库。
2、业务:没有成熟的业务模式
很多公司战略上需要数字化转型,觉得要建标签库,但却没想清楚哪些业务场景必须依赖标签库才能做成或者做的更好。
以前我们建设标签库往往是技术导向,宽表摇身一变贴个标签就成了标签库,好听一点是标签库,其实是个取数工具,根本没有跟哪个业务有天然的捆绑,好像什么都能做,其实哪一个都做不好。
对于绝大多数企业来说,体系化的标签库都是为钱服务的,当然对于大数据变现来讲,标签库也是为钱服务的。
毫不夸张的讲,我们对外的信息流完全依赖于标签库,其标签的使用率和覆盖面远超对内针对传统业务,根本不需要做什么,这叫做找对了业务模式。
3、管理:跟核心业务流程的脱节
大多数标签库的建设是以系统建设为核心的,却没想过管理流程上要做哪些改变,很多标签库希望通过运营来促进使用,但往往事倍功半。
因为传统流程已经固化,谁都不想改变习惯,手工取个数也蛮方便,导入导出也很方便啊,即使效率低也没关系。还有些公司的报表系统还在用Excel,这想建立标签库根本不可能。
更为关键的是,一旦标签库作为可有可无的存在,其自身就没有了迭代优化的机会,因为谁都不会提出问题,然后标签库就死了,成了技术人员自我陶醉的工具。
标签库从建设伊始,就要与业务人员协同制定规则,强行插入企业的管理核心流程,比如不走标签库就不允许进行一些措施,否则,再好的酒也怕巷子深。这种教训很多。
但即使这样,能做好标签库的也是寥寥。
4、建设:一线的业务理解比你强
属性类的标签就不说了,这里重点谈谈通过建模打造的标签。
建模最重要的是什么,当然是业务理解,其实当前大多数企业的组织形式是不利于标签运营的,最懂业务的在前端部门,做建模的在后端部门,两者的沟通成本太大。
现在某些企业存在着IT属地化的特征,我觉得这倒是一种很好的组织形式,其提供了灵活性。
那么,后端部门做什么?
做好数据中台,为前端赋能;吸取优秀经验,统一部署;研发核心标签,解决数据技术问题。
可以肯定的是,90%以上的标签其实属地的人员简单的规则配置就能搞定,只要你提供的数据中台足够强。
可惜的是,一方面现在很多企业的标签还是要靠后端部门统一打造,甚至立项解决,这样出来的标签可用性不会很好;另一方面,则是后端的人员太少了,或者说能力完全不够,无法做好数据中台,更没有精力去做什么运营。
失败是显然的。
标签库不是简单的一个系统,是企业数据产品能力和数据资产管理能力的一个综合体现,数据团队有多少实力,其实看看标签库就知道了,它就是一面镜子。
5、治理:淹没在海量标签的噪声中
最近某网站的实体书下线了,笔者觉得蛮可惜的,因为它的推荐和评价系统很好,然后转战别的网站,发现特别不适应,当然有使用习惯的因素。
然后我发现了二个原因:一是给出的某本书的搜索结果太多了,让一个新人不知所措,二是海量的垃圾评价,即使是有用的信息都被淹没了,这是怎样一种体验?
同样的问题也出现在我们的标签库中,你看下面一张列表就知道做这个事情的重要性了:位置类标签快要统治全世界了!
要建设和运营好标签库非常不容易,很多问题不是你想解决就能解决的,但只有知道了根本原因所在,你才能知道努力的方向,希望我的分享于你有启示。
原创文章,作者:Maggie-Hunter,如若转载,请注明出处:https://blog.ytso.com/tech/bigdata/173483.html