推理任务的可过滤性。尽管输入过滤技术已在很多具体应用中显示出优化效果,但往往是由主观的对冗余输入的观察而启发的。如果不能从理论上回答“哪些推理任务存在输入过滤的优化机会”这一问题,则输入过滤技术的应用难以避免高成本的试错过程;
鲁棒的特征可区分性。输入数据的特征表达直接关系到进行推理跳过和找到可重用推理结果的精度,因此对于输入过滤的表现有着关键影响。现有方法多数依赖手工特征或预训练深度特征,这些特征在应用过程中没有鲁棒的可区分性,可能完全失去过滤效果。
在MobiCom上,中国科学技术大学LINKE实验室针对移动为中心的模型推理场景,提出端到端可学的输入过滤框架InFi(INputFIlter)。该工作首次对输入过滤问题进行了形式化建模,并基于推理模型和输入过滤器的函数族复杂性对比,在理论层面上对推理任务的可过滤性进行了分析。InFi框架涵盖了现有的SOTA方法所使用的推理跳过和推理重用机制。基于InFi框架,该工作设计并实现了支持六种输入模态和三种推理任务部署方式的输入过滤器,在以移动为中心的推理场景中有着广泛的适用性。在12个以移动为中心的人工智能应用上进行的实验验证了理论分析结果,并表明InFi在适用性、准确性和资源效率方面均优于SOTA方法。其中,在一个移动平台上的视频分析应用中,相较于原始推理任务,InFi实现了8.5倍的推理吞吐率并节省了95%的通信带宽,同时保持超过90%的推理精度。论文转载请注明:http://www.0431gb208.com/sjszlff/983.html