当前位置 鱼摆摆网 > 问答 > 创业 >

互联网创业公司如何建立数据团队?

栏目:创业   时间:2019-09-07 15:34
如何从零开始建立第一个专门负责数据的团队?会面临什么样的挑战?有哪些坑可以避免?有哪些是核心职能?哪些工具适合使用?需要招收什么样的人员?互联网创业公司如何建立数据团队?
[ 标签:互联网创业 ]

  • 全部评论(6
  • 1楼
    刘洋 2019-09-07 18:34:02

    选Leader,数据部的Leader,要包含下面三个基本技能至少其中两个:1. 懂数据及其相关技术


    可以不会具体实施,但是各种存储的优缺点一定要了然于胸,例如我可能不了解Storm或者Spark的API,但是它们的性能、应用场景一定是要清楚的。

    2. 行业经验

    对公司所面对的行业和客户群体有深入的了解过,知道行业现状,知道所处行业哪些方面有数据层面的痛点,贴合业务的数据结构,或者说是超出业务预期的数据结构(逆向指导业务、技术驱动)将会使公司事半功倍。

    3. 数学

    如果公司最终的走向是机器学习和人工智能,那么精通数学算法非常重要,很多看似不可实现的功能,其实在数学领域有很多很多解决方案,有些解决思路甚至几百年前就有了。

    选Crew,除了包含一般开发人员所需要的基本素质,如果打算自己培养新人,注意以下两个的特质:1. 数学能力

    尽可能的有数学方面的研究,可以不是数学系毕业,但是如果知道并能够通过代码实现简单的线性回归,并能够说出其原理,那自然是很不错的一个苗子。

    2. 脑子灵活

    数据处理,技术要求其实并不高,那么脑子灵活的人要比技术好的人更值得关注,在经过短暂的培养就能独当一面,偶尔还能“诈尸”解决棘手问题,一个勤奋但是愚蠢的人会让你非常头疼,而搞大数据相关的东西,机器性的经验虽然重要,但是更重要的还是脑子。

    其他问题面临的挑战主要是来自友军,友军设计的库表、数据结构经常让我们叫苦不迭,技术层面就有各种奇奇怪怪的设计,例如我们通常建议浮点型数字用long来存储、宁乘不除,可现实情况往往出现有些部门用String来存储数字(不讨论优劣),有些部门用浮点类型,甚至有的表,两个数值类型分别用String和Double存储的,还有些人为了体现知识的渊博用Bigdecimal的(其实用不着);而业务层面的友军给我们造成的暴击是技术层面的Double。

    其次,混合型的数据服务会牵扯较多的技术,例如流式计算、缓存、消息、文本解析、Excel处理甚至是图像识别之类杂七杂八,对于大多数系统开发人员而言,他们可能最多就是写一写Spring、MyBatis,在复杂一点就是集群分布式,而你做数据就可能牵扯到各种各样的效率问题、数据解析问题,有时候为了完成一个需求,我们在技术上无所不用其极,C++、Lua、Python哪个能最好的解决问题用哪个。

    部门成长过程中遇到哪些坑?实在太多,都不知道从何说起。首先,上面提到了,是提防友军,除了上面提到的友军误伤之外,还包括:多源复制的时候,有些库表严重拖后腿。

    其次,数据库一定要备份,最后的堡垒,只要数据还在,其他的都好说,其他的坑实在太多,不一一说了。


  • 2楼
    田小宇 2019-09-07 18:04:02

    从宏观上来说,公司层面上主要是建设数据生态,亦即建设企业整个数据采集,使用和合作的数据文化。从微观上来说,主要是着重建设稳定的数据流,亦即数据存储,分析,算法,可视化的数据处理流。从这几个目标来看,你需要团队角色数据产品经理,商业分析师,数据运营,数据研发工程师,算法工程师等。这些角色需要根据你们公司和业务团队的需求状态来搭配。所以楼主需要提供更多信息,包括但不限定于:公司人数,目前数据处理相关的人员分配,业务情况,所属行业等等。有更多问题欢迎关注微信公众号:数据产品经理会 ,这个公众号有个配套的数据产品群,可以加我微信申请:liuyangfjnu

  • 3楼
    李大副 2019-09-07 17:34:02

    有钱就招人,没钱就别折腾了。还不如把住KPI

  • 4楼
    李炳辰 2019-09-07 17:04:02

    入不敷出,钱多烧的就当我没说。

  • 5楼
    萝魏紫 2019-09-07 16:34:02

    理解业务,收集数据,存储数据,清洗转换数据,提取数据,分析数据,评估分析,应用。完美的最后是数据科学家的专长。前面都是工程师的战场。

  • 6楼
    陈然 2019-09-07 16:04:02

    这要看你是什么公司,我假设你已经有了数据来源。那么数据仓库的设计是第一重要的,否则效率感人。这个基本靠你的CTO功力。其次选对分析工具和平台,再次是业务目标。

说点什么吧