职位描述
d evelop 进行接口框架,如深学习编译器的堆栈 Tensorflow ,Caffe2 , Keras 等和神经网络(CNN / RNN)转换成适合于优化的内部表示。
开发新的优化技术和算法,以有效地将CNN映射到 Kneron NPU 处理器上
实现最先进的代码生成(源到源以及二进制)
开发支持数据压缩技术,量化算法,张量稀疏性增强,网络修剪 等
设计多处理器/多核分区和调度策略
开发复杂的程序以验证CNN应用程序编程工具包的功能和性能
内核,基准测试和CNN 应用程序的性能分析 。
新的编译器功能开发和调试。
帮助编写和查看产品文档
协助应用程序工程团队为产品客户提供支持(可能需要进行一些直接的客户交互)。
要求
3-5年以上的生产编译器工作经验。
高级编译器构造,独立于目标的优化和分析,代码生成基础 是 必须的。
需要专业的软件开发,测试,调试和发布。
伟大的C ++是必须的,Python是强制性的,但不那么紧迫。
对LLVM编译器堆栈的了解和经验是非常可取的(其他最先进的编译器也有资格)。
高到中间优化空间:循环优化,多面体模型,IR构造/过渡/降低技术是一大优点。
之前与CNN的合作以及对深度学习框架(Tensorflow ,Caffe / 2等)的熟悉是一个强大的优势。
熟悉最先进的深度学习编译方法是一个巨大的优势:XLA,Glow,ONNX,Tensor Comprehensions等。
熟悉各种深度学习网络及其应用(分类/分段/对象检测/ RNN)是一个优势。
神经网络交换格式(NNVM,NNEF)的知识是一个奖励