项目介绍:
搜狗智能语音项目致力于打造业界领先的以语音为主的多模态输入、理解以及表达的人工智能技术。“AI合成主播”是在搜狗“分身”技术的支持下,通过人脸关键点检测、人脸特征提取、人脸重构、唇语识别、情感迁移等多项前沿技术,并结合语音、图像等 多模态 信息进行联合建模训练后,生成与真人无异的AI分身模型。该项技术能够将所输入的中英文文本自动生成相应内容的视频,并确保视频中音频和表情、唇动保持自然一致,展现与真人主播无异的信息传达效果。
工作职责:
1. 负责高精度动态人脸重建,高仿真说话人等相关算法研究;
2. 负责相关技术算法研究,工程落地与持续优化。
任职要求:
1. 图像处理等计算机相关专业,硕/博均可;
2. 熟悉GAN等深度学习算法并至少掌握诸如TensorFlow、Pytorch等其中一种深度学习工具;
3. 具有扎实的C/C++编程能力,至少掌握python等一门脚本语言;