<汇港通讯> 小米(01810)发布和全量开源声音理解大模型 MiDashengLM-7B。
据介绍,MiDashengLM-7B 声音理解性能在22个公开评测集上,刷新多模态大模型最好成绩(SOTA),单样本推理的首 Token 延迟(TTFT)仅为业界先进模型的四分一,同等显存下的数据吞吐效率是业界先进模型的20倍以上。
在目前版本的基础上,小米已著手对 MiDashengLM 模型做计算效率的进一步升级,寻求终端设备上可离线部署,并完善基於用户自然语言提示的声音编辑等更全面的功能。(BC)
#小米
新闻来源 (不包括新闻图片): 汇港资讯