登录 注册
当前位置:主页 > 资源下载 > 50 > LightSeq:一款用于NLP的高性能序列推理引擎

LightSeq:一款用于NLP的高性能序列推理引擎

  • 更新:2024-10-18 19:10:26
  • 大小:33.04MB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:深度学习 - 人工智能
  • 格式:PPTX

资源介绍

在本次分享中,会介绍LightSeq团队在过去一年多时间里,针对自然语言处理领域的序列(sequence)模型,进行的推理优化工作。自2017年Google提出Transformer模型,以其为基础的特征提取方法,推动了众多自然语言处理任务能力水平的提升,与此同时,模型的参数量和推理延迟也呈现近乎指数增长。为了满足业务场景严苛的部署要求,LightSeq 团队结合场景特性:1. 对特征运算进行了定制优化 2. 对自回归解码进行了层次化改写 3.引入编译优化技术进一步提升计算吞吐。成为业界第一款完整支持Transformer、GPT等多种模型高速推理的开源引擎。模型层面,LightSeq团队也探