伴随着5G网络在全球范围内的大规模部署和商业化,人工智能等新技术的落地开始呈现加速趋势可是,从理论概念到真正的商业实现,人工智能仍有许多问题需要解决无论是数据模型计算的准确性,还是AI应用的硬件平台性能,都还处于初步探索阶段
9月16日詹瑞举办的UP 2021展锐在线生态峰会mdashmdash在AI前沿技术与研究论坛上,包括展锐内部技术专家,学术机构科研专家,工业领域创新企业负责人在内的众多嘉宾发表并分享了他们对AI前沿技术的研究成果,从模型自适应优化到深度学习,再到神经网络部署和AI训练平台精彩的内容让我们对这些技术有了更深入的了解
詹锐专家谈AI技术从挑战到实际应用。
在人工智能的整个应用中,需要高效的仿真,高效的模型推理需要软硬结合的结果占玛纳斯技术实验室主任陈经纬在演讲中指出,如何开发出更适合平台的算法,是当今面临的重要挑战
詹玛纳斯技术实验室主任陈经纬。
鉴于此,展锐提出了一种硬件适配的模型优化模型具体来说,在原有模型的基础上,只尝试面向硬件的结构微调和模型压缩方案,复杂度相对较低该模型支持不同的优化策略,可以选择精度优先和数量优先的方式进行搜索同时,该模型具有良好的扩展性和自由度,可以增加或减少替代精度表示,也可以增加其他优化方案此外,知识蒸馏可用于减少中间结果的评估时间,在线Profiling可用于评估中间结果的性能和瓶颈位置
詹锐技术专家李瑱。
对此,詹锐提出了NNMRT方案,利用异构硬件加速器,通过离线工具链对NN网络进行编译优化,在线微运行时高效调度操作人员,从而提升部署到异构平台的AI算法性能展锐团队通过与NPU,VDSP集成的T770平台验证了这一模型编译器在NPU上部署了一些操作符,在VDSP上部署了一些操作符,提高了模型部署的效率
具体到实际的AI应用,詹锐等三位专家分别介绍了基于神经网络的全场景摄影技术,基于深度学习的多目标检测与跟踪以及基于深度学习的语音增强技术。
展锐多媒体技术专家刘前顺指出,目前智能手机摄影面临的挑战包括硬件配置有限,动态范围差,环境照度低,模糊和噪声等为此,展锐开发了基于神经网络的全场景解决方案,包括智能曝光,多帧降噪,动态范围增强三大模块
展锐多媒体技术专家刘前顺。
以智能曝光模块为例,包括运动模式判断,曝光帧策略和场景语义信息该模块将综合考虑环境亮度,图像直方图统计,陀螺仪,加速度计和人脸检测结果,进而配置最佳方案画面显示并选择参考帧后,场景语义分割模块生成天空,绿植,人像,建筑等12种语义遮罩通过这三个模块的结合,可以大大提高手机拍照和成像的质量
同时,在已广泛应用于智能安防监控,无人驾驶,机器人,人机交互,视频分析等领域的多目标检测与跟踪技术中,展锐技术专家勒庞介绍了展锐采用的基于深度学习的多目标检测与跟踪算法:在权衡性能和效率的关系后,詹锐选择了JED框架作为其跟踪框架,这意味着检测和跟踪可以在同一个网络中同时完成。
詹锐技术专家勒庞。
同时,由于检测性能对多目标跟踪的性能尤为关键,展锐选择了基于Anchor的方法作为其检测器框架,并对网络结构和损失函数进行了一系列优化,保证了检测性能在良好检测结果的基础上,有必要更好地关联数据在这方面,展锐采用运动信息与外观特征相结合的形式,在外观特征的网络分支中加入关注模块,增强了外观特征的学习
此外,展锐多媒体技术专家董飞详细介绍了基于深度学习的语音增强技术董飞说,智能终端经常需要在各种场合进行通话,音视频会议,游戏语音实际使用中,大多数场合都受到噪声,啸叫,回声等干扰导致语音受损,严重影响语音质量
展锐多媒体技术专家董飞。
据介绍,基于深度学习的方案,辅以信号处理方案,结合两者的长处,是目前智能终端语音增强的最佳解决方案紫光展锐的语音增强技术包括上下行处理通道,具有回声消除,噪声抑制,回声抑制,EQ滤波,自动增益,啸叫抑制等功能整个解决方案中最重要的部分是基于深度学习的算法模块,它是为了满足智能终端对语音增强算法的三个要求而设计的除了抑制噪音和啸叫,深度学习在语音其他技术方向的应用也是未来的发展趋势
行业大咖解决AI培训平台和计算架构问题。
除了上述来自展锐自身的技术专家外,致力于为行业提供自动化,平台化AI开发服务的国内AI领域初创企业工大地创新科技有限公司产品总监刘荣杰,交通大学AI领域知名学者任教授也分享了他们的研究课题。
工大地创新科技有限公司产品总监刘荣杰
刘荣杰分析,AI实际落地还存在很多障碍。
,核心问题包括人员不可控,成本不可控,调参不可控,精度不可控以及部署不可控而AutoML技术可以解决这些痛点,但当前的主流方案仍存在一些问题,首先是模型搜索效率低,难以应用于工业规模的数据集,并且搜索过程不稳定结果不可控,无法针对硬件芯片进行定制针对以上问题,共达地的核心AI团队做了大量工作,最终真正实现了可落地的AutoML自动化训练平台
据其介绍,这一AI自动化训练平台的总体架构和优势体现在:低门槛mdash,mdash,整个AI模型开发流程自动化,从而降低了AI落地的门槛,性能高mdash,mdash,通过可落地的前沿算法实现高精度模型的生成,一键到端mdash,mdash,通过与主流芯片的深度支持,实现模型一键下发至终端简化整体模型部署流程,定制无忧mdash,mdash,每个模型都是根据场景定制化搜索生成最优模型,不再需要人工设计高效低成本,高效低成本mdash,mdash,一次训练即达最优,免去人类专家多次尝试多次调整,效率提升80%以上,开发成本降低95%以上。
在此次论坛上,西安交通大学任鹏举教授以《面向自主智能体的高效计算架构思考》发表了演讲他表示,以智能边缘,计算机视觉,自动控制等创新技术作为支撑的自主移动智能体,在以无人驾驶为代表的交通领域和以AGV为代表的物流领域将会有广泛的应用不过,这些自主移动智能体在解放生产力的同时,对计算架构也提出了新的设计要求
西安交通大学任鹏举教授
他认为,面向自主智能体感知与协作的计算架构,应满足多种不同功能自主智能体及其应用场景的信息处理需求相比于市面上现有的计算架构: x86工控机,嵌入式GPU,ARM+FPGA等方案,具有更好的适应能力,任务重构能力,灵活性和升级能力其主要特点体现在:LEGO式模块级拼接融合的工作模式,高通量的多传感器实时信息融合处理,数据流控制流相融合的高效处理方式,可扩展的分布式智能体协同调度机制