,在今年 8 月的 2023小米雷军年度演讲上,小米 AI 大模型首次公布。相比其他公司的千亿万亿参数模型,小米 AI 大模型并没有专注于扩张超大参数,而是尝试将 13 亿参数的模型放到用户的手机本地运行。
近日,小米集团 AI 实验室主任,自然语言处理首席科学家王斌在接受声动活泼采访时透露了他们的考量,并表示未来一定是大小模型共存,通用和专用共存的状态。
王斌称,与其他公司不同,小米拥有大量设备,目前这些设备的计算能力已经大幅提升,比如现在手机上搭载的芯片计算能力比以前提升很多。其次,小米是重端侧的公司,如果要大量调用云端算力,成本比较高。此外,用户隐私、用户使用手机时的网络情况等也是我们的考量因素。
不过,大模型的参数量太小也会影响用户的使用体验,因此小米需要在模型规模与硬件门槛之间做好平衡。
王斌表示:“我们相信除了通用能力,不同维度的小模型可能更适合某一项任务,所以最后可能是以混合体的形式出现,既有云端,也有端侧,既有大模型,也有小模型,通过共通的生态把用户体验做到极致。”
据IT之家此前报道,雷军在 2023 年度演讲中表示,小米已经布局 12 个技术领域,99 个细分赛道,未来 5 年技术投入 1000 亿元人民币。在 AI 方面,小米从 2016 年 7 月起就开始布局,今年 4 月成立大模型团队,相关团队超过 3000 人。
目前,小爱同学现已开始升级 AI 大模型能力,不过还没有大范围开放。
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。