职责范围:
1.开发,维护和操作复杂的数据管道
2.构建工具以监视和警告数据质量和可用性
3.设计和开发工具和自动化功能,将数据公开给公司的其他部门-从研究到培训机器学习模型的可扩展自动过程。
要求:
1.在分布式可扩展系统的后端开发方面有6年以上的经验-最好使用Python。
2.在Linux上有6年以上的经验。
3.从需求到实施至少在端到端领导一个数据项目的以往经验
4.4年以上数据工程经验-数据管道设计,实施,运营
5.1+使用无SQL数据库的经验-cassandra / hbase / Elastic / Mongo / Couchbase / Redis至少之一
6.理学士。计算机科学
技能专长:
1.Python专家-非常强大的优势
2.机器学习背景/知识-非常强大的优势
3.Hadoop / Spark-强大的优势
4.Docker-强大的优势
5.监控系统,警报等-优势
6.Node.js-优势