写给大数据从业者:数据科学的5个陷阱与缺陷
发布时间:2019-08-29 15:17:25 所属栏目:评测 来源:陈炬
导读:副标题#e# 最近看新闻,发现数据科学专业已经是北京大学高考入学门槛较高的专业了,其实Data Science 这个词性感了快十年了,对互联网行业而言,相当于性感了一个世纪。 从数据说话,DT 时代,到 数据中台,数据驱动(Data Drive/Data Driven),数据体系的
LinkedIn、Uber、阿里等等公司都在尝试做批流融合,严选也在尝试,我们在做计算资源管理和调度层面的融合。但是,融合两种完全不同的计算模型,是一件不美好的事情,直觉上也不大对。我觉得现实的业务问题可能并不是聚焦在批流两种计算模型的不兼容上,而是聚焦在实时和离线两个时间维度上的不兼容。由于历史原因,实时的数据往往需要依赖流计算模式来产生,从而产生了实时计算 == 流计算的误会。而融合实时数据与离线计算,解决起来就容易很多 。而流处理也需要走向更适合它的场景。 其实能总结的问题远不止这些,比如我们会担心“算法替代思考,会不会伤害组织的远见?”、“大规模依赖 A/B 测试做决策,可能会导致运营策略的短视” 等等。 【编辑推荐】
点赞 0 (编辑:广州站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |