从0到1构建数据生态系列之六:数据价值挖掘
数据时代的搜索引擎 就信息检索来说,搜索引擎早就存在,而且一直存在,但早期的搜索引擎只有一个目的,那就是检索与检索词相关的信息。 这里所说的相关,纯属于信息实体属性相关。当然,这样做当然是无可厚非的,信息检索的本质本来就是检索相关的信息。 但随着数据进一步应用,以及机器学习等技术的推广,搜索引擎的模式也在悄然发生改变,只是你或许并没有过多关注而已,只是感觉搜索越来越好用了。 我们知道,中文博大精深,一句话,稍微改动一下,或者说重新组织一下,意思都可能发生巨大的变化,甚至是相同的一个词,理解的角度不同,其意义都是不相同的。 在过去,这种情景是很难处理的,而如今,随着对数据的进一步应用,以及算法模型的进一步开发,搜索意图识别已经算是“正经”搜索引擎的标配了。 除此之外,还有诸如搜索纠正,相关搜索推荐等基本的优化点,用于提升用户的体验。 最大的改变在于,过去的搜索是一个“点”,而现在的搜索结果是一个“面”。 所谓的“点”即是你所搜索直接关注的目的,也就是信息本身,而“面”则是一个多维结构,在你关注的点的同时,扩散所有的相关信息。 这就是知识图谱在搜索中的应用,产生的搜索结果是一整个相关的知识图谱结构。
相对于上面描述的几个相对明确的数据价值应用,这里描述的就相对于偏业务层,并没有说具体涉及到某种模型,具体的算法,而是一种业务驱动模式。 我们希望通过数据,能够构建起业务驱动的自动化流程,并且这整个业务流程是可数据化观测的,然后在一些关键环节是可以智能化运作的,这样就能够提升业务的精准性。 当然,更重要的是提升商业转换价值。 期间,我们可以利用各种统计分析的手段,让业务流转是可以数据可观测的,也可以通过诸如画像属性的进一步业务化,也可以使用诸如推荐、预测等相关相对底层的技术,甚至是可以利用更复杂的神经网络深度学习等自动学习、自动优化的手段。 关键在于使用数据,再结合机器学习的手段来优化整个流程,这才是我们所需要的。
最后,随着数据的价值在逐渐被挖掘,上层将会越来越多的应用模式被探索出来。 但可以预见的是,数据价值的使用,必然会从单纯的数据本身价值,逐渐延伸到更多的其他方面,而作为数据价值探索的手段,机器学习相关的技术和数据的结合也会越来越紧密。 擅长大规模数据挖掘相关技能的人,也将会越来越受到欢迎。 扩展阅读: 《从0到1构建数据生态系列之一:蛮荒时代》 《从0到1构建数据生态系列之二:拓荒》 《从0到1构建数据生态系列之三:拆解架构图》 《从0到1构建数据生态系列之四:与研发的爱恨情仇》 《从0到1构建数据生态系列之五:让你的数据生态变得更高效》 《从0到1构建数据生态系列之六:数据价值挖掘》 最后: 2017年第一个工作日,从0到1构建数据生态系列最后一篇,顺便将其他五篇全部放出来,算是17年的好开端,也祝大伙儿2017年工作更顺利,最重要的是少写几行代码。 --题图,From 699pic,“朱家角古镇建筑”,很赞的图。 (编辑:成都站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |