01 所有行为都会留下数字化痕迹的今天,产业转型升级的起点正在形成
上网、社交、购物生成的数据正在为商家提供新的商业指导;“智能化”设备的彼此连接、通信产生的海量共享数据让工厂中的机器更加可靠。大数据的异军突起正成为时下主流趋势之一,加之“独角兽”概念助力,新兴的大数据行业蕴藏诸多机遇。
02 大数据框架的选择不尽相同
主流BI软件和可视化工具在分析过程中发挥重要作用,但半结构化和非结构化数据基于其特殊、无序性,可能不适应传统的数据解析。此外,需要经常更新的大数据集所带来的问题亦是行业需要克服的挑战之一。
因此,Hadoop和其他相关工具所构成的开源软件框架核心,则正成为行业关注的方向之一。Hadoop框架的核心设计分为HDFS和MapReduce两部分,其中HDFS为海量数据提供了存储,而MapReduce则为数据的计算提供了可能。
没有最正确的选择,只有更适合自己的解决方案。除了Hadoop,还有许多其他框架供大数据企业备选。如Talking Data便为提高集群计算效率和程序开发效率,选择了Spark。虽然Scala语言的特性也非常多,但Spark对Scala语言的掌握程度要求不高,对一般程序员而言,一周时间足够掌握,程序开发效率相比Hadoop MapReduce提高了一倍。
传统企业做数据化转型都是希望在原来的基础上做非常小的改动或者调整,这种思维模式十分局限,需要大数据解决方案提供商拿出行之有效的数据方案加以助力和引导。大数据多而繁杂,又具有动态特性,多数业务面临能否正确解析数据的挑战,仍需时间检验。
03 10亿美元的估值只是一个象征性的门槛,独角兽更像是一个美好的期许
主流舆论对于独角兽的关注,似乎在歌颂一个个成功崛起的初创企业的光与热,但我们更愿意将其定义为鲜活的、充满活力与正能量的团队,我们想寻找那些在行业中不断打磨与成长的新星。
互联网行业是中国诞生独角兽最多的领域,借助这一基础设施,以数字金融、云服务、Saas为代表的企业正在崛起。入场A股的限制颇多,但值得庆幸的是,“创投国十条”的发布对我国创投行业发展影响深远,随着创业投资行业的不断壮大,融资结构正撬动实体与服务,为独角兽的成长奠定了坚实的政策支撑。
借助资本的力量,数据与技术的魅力正在这些“独角兽”身上激荡出别样的风采。如创略科技便将非结构化的文本信息进行主题、关键词的情感分析,为客户制作用户流失预警分析模型,提前预测有可能流失的客户,并根据流失的可能性程度进行分类、预警及标签化,及时挽留有可能流失的客户,同时分析流失的原因,将数字营销的影响放大至整个商业生态中。
数据能力的扩张将增大对大规模、复杂模型的预测和分析能力,“独角兽”的神话依然会继续,如果一个人的思维不改变,所有改变都徒劳无功。
我们正处于数字革命之中,这种革命不是技术,而是意识形态。