雷军:小米研发大模型的方向是轻量化和本地部署
在上周的年度演讲上,我宣布了小米科技战略升级:深耕底层技术、长期持续投入、软硬深度融合,AI全面赋能,即(软件×硬件)??。同时,也给大家介绍了小米的科技理念:选择对人类文明有长期价值的技术领域,坚持长期持续投入。
AI是未来的生产力,也是小米决定长期持续投入的底层赛道之一。我们在很早就开始组建AI团队,相关团队成员已经超过3000人。这些年的持续投入,为我们的自动驾驶、机器人等业务都取得了非常优秀的成果。
(资料图片)
今年,我们迎来了一次重大的技术革命——AI大模型技术,在4月份,我们组建了AI大模型团队,并快速在小爱同学上落地应用。
我们做大模型的思路可能和很多公司不太一样,我们选择主力突破的是轻量化和本地部署。
为什么呢?
首先,大模型需要海量数据,所以很容易涉及到隐私问题,还需要巨大算力,用起来成本也很高。接着,我们是一家手机公司,怎么把自己的优势利用起来?我们想的是,它能不能轻量化?能不能本地部署,在手机端就能用上大模型?
沿着这个思路,我们团队进展非常顺利,小米自研大模型在近日的权威中文评测榜单C-EVAL和CMMLU中,取得同参数量级第一的好成绩;小米自研手机端侧大模型初步跑通,部分场景效果媲美云端。真的特别特别厉害。
很多人还想了解小米大模型研发的更多信息,今天,就和大家好好聊聊。
0 1
解码大模型
ChatGPT出现以来,大模型优异的理解能力和生成能力令人惊艳,关于其用途的探索也越来越多。目前看来,很多传统的自然语言处理任务都可以用它来完成,比如搜索、翻译、问答、摘要、信息抽取和分类以及写作等。在日常生活中,所有基于对话的服务,如客服、教育、咨询、导游等,以ChatGPT为代表的大模型都有一定的用武之地。
大模型指参数数量巨大、层次结构复杂的机器学习模型。这些模型通常具有十亿到千亿甚至万亿个参数,通过大量的数据进行训练,提供更高的理解和生成能力。
在我们看来,大模型不仅是指模型参数多、尺寸大,更重要的是代表了一种新的训练范式。我们将其总结为:大数据、大任务、大参数。
-大数据:指需要用海量的数据去训练,让模型从中自动挖掘出所需的信息。通常采用自监督或者无监督学习方式,无需人工标注就可以提炼规律、学习知识,从而提升模型的眼界。
-大任务:指学习的目标足够复杂、覆盖面广。这样才能“强迫”模型按照模块化、高类聚、低耦合的方式组织知识点,实现举一反三的泛化能力。
-大参数:指模型的知识容量。大模型的参数规模越大,模型的表达能力和学习能力也就越强。
在这个范式中,我们认为大数据和大任务是不可或缺的。如果没有大数据,模型不可能学到丰富的常识;如果没有大任务,知识点和技能点不可能在模型中有机高效地组织起来。
0 2
布局人工智能
全力突破大模型
▍以AI为基石,沉淀技术积累
我们基于未来的思考与理解,选择对人类文明有长期价值的战略方向,并坚持长期持续的投入。我们已经布局了12个技术领域,99个细分赛道,未来五年(2022-2026)至少投入1000亿以上的研发经费!
AI是未来的生产力,也是小米长期持续投入的底层赛道。小米很早就对人工智能进行布局,2016年小米AI实验室成立,并组建了第一支视觉AI团队,今年4月成立专职大模型团队,历经7年6次扩展,小米人工智能团队已经有3000多人,逐步建立了视觉、语音、声学、知识图谱、NLP、机器学习、多模态等AI技术能力。
成为浪潮之上的角逐者,必须有对技术的沉淀和积累。作为小米AI技术的“试验田”和“弹药库”,小米AI实验室会研发中长期的前沿技术,围绕小米业务做储备,在集团需要的时候输出“弹药”。小米对AI的深刻认识与掌握的技术能力,也有效地赋能了手机、机器人等各个业务板块。
大模型是未来科技的发展趋势,更是下一个人工智能的高地。2021年开始,小米就对大模型的方向特别关注,并开展了对话大模型的预研工作。在闲聊对话场景下,依托于月活超过1.15亿的智能语音助理小爱同学,小米研发了参数规模为28亿的对话模型,达到了当时同等参数规模下业界的较高水平。这为小米积累了多卡分布式训练的经验,为后续开展大规模语言模型训练奠定了基础。
▍小米大模型:轻量化、本地部署
小米拥有品类众多的设备,是全球规模领先的消费级物联网平台。设备多样,使用场景也各不相同,一个大模型难以兼顾。如果把一部分大模型能力下放到端侧,不仅能更好地保护用户隐私、而且有机会在本地实现千人千面的个性化定制。
软硬结合,生态连结,这是大模型技术与小米生态结合的最优方案,让用户既可以拥有数据安全,又可以拥有大模型的先进生产力。因此,“轻量化、本地部署”是小米大模型技术的主力突破方向。
目前,我们自研的13亿参数的端侧模型已经在手机端跑通,部分场景效果媲美60亿模型在云端的运算结果。与早些时候市场上放出的手机端大模型的方案相比,小米会调整模型结构和参数大小,适配各种芯片在内存和算力上的特点,致力于达到功耗、推理速度和生成效果的最佳平衡。
0 3
布局人工智能
全力突破大模型
▍自有数据更懂小米
数据上,我们自己挖掘整理的训练数据占比达到了80%,其中小米自有的产品和业务数据量达到3TB。因此我们的大模型最懂小米的产品,最懂小米的业务。
▍效率和效果的最佳平衡结构上,我们根据对Transformer结构的理解,融合了自身的实践经验进行改良;并且充分考虑设备端芯片的特色要求,合理设置模型的宽度和深度,致力于达到效率和效果的最佳均衡。▍更多策略更少浪费
训练策略上,采用小米提出的ScaledAdam优化器和Eden学习率调度器,显著提升收敛速度的同时减少了优化器中显存的浪费。由于模型的知识容量有限,需要更精巧地安排训练数据的顺序,使得模型尽可能多地掌握知识点和技能,减少参数的浪费,以此实现“轻量化”。
▍为用户隐私安全保驾护航模型部署到端侧后,信息不用上传到云端,所有计算都在本地进行,可以从根本上保证用户隐私不被泄露。即使在端云结合的服务框架下,隐私信息会存储在端侧,涉及它们的计算也尽可能在端侧完成。即使偶尔需要使用云端的能力,信息也会经过处理和加密。
0 4
仰望技术星空
脚踏体验实地
截至2023年8月10日,小米自研的大规模预训练语言模型MiLM-6B,参数规模为64亿,在权威中文评测榜单C-EVAL和CMMLU中位列同等参数规模大模型第一。
在C-Eval评估中,MiLM-6B 的平均分为60.2,总榜单排名第10、同参数量级排名第1。
“C-Eval”是由上海交通大学、清华大学、爱丁堡大学共同构建的一个针对基础模型的综合中文评估套件。它由 13948 道多项选择题组成,涵盖 52 个不同学科和四个难度级别,覆盖人文、社科、理工,及其他专业四个大方向,用以帮助中文社区研发大模型。
在CMMLU评估中,MiLM-6B在Five-shot和Zero-shot 测试中的平均分分别为57.17和60.37,均位列中文向模型第1。
“CMMLU”是一个综合性的中文大模型评估基准,涵盖了从基础学科到高级专业水平的67个主题,涉及自然科学、社会科学、人文、以及常识等,专门用于评估语言模型在中文语境下的知识和推理能力。
通过打榜,验证了我们对特定垂域进行定向增强的技术能够达到怎样的效果,这也是用轻量化模型进行业务定制的必备能力。虽然小米大模型取得了优异的成绩,但我们不会把榜单排名与用户体验画上等号。好成绩的背后,更重要的还是打磨技术、沉淀方法论,将它们运用到产品,提升用户体验才是我们的终极目标。
科技应着眼于解决问题,以需求与应用为落点。小米大模型采用“轻量化、本地部署”的方案,能够更好地解决多场景、个性化的用户需求。一方面,大模型本地运行无需担心“弱网、无网”情况,且响应速度快,使用稳定;另一方面,在提供更加个性化服务的同时,也能够更好地保护用户隐私,让技术真正改善用户体验,让成绩真正落地有效。
0 5
始终坚持小米愿景
始终坚持技术为本铁律
小米作为一家科技公司,将始终坚持我们的愿景、价值观:让所有人都能享受科技带来的美好生活,同时始终坚持技术为本的铁律,持续加大研发投入。2023年,小米研发投入预计会超过200亿。
此外,截至目前,我们的全球专利数已超过32000+件。质量也非常高,在《全球5G标准必要专利及标准提案研究报告(2023)》中,首次进入全球前十,可以说,在榜的企业,小米是最年轻的,速度最快的!
小米还很年轻,但是在技术投入与技术积累上,已经走在前列,取得了巨大的进展。时代在不断变化,小米也在不断成长,这一次小米科技战略升级,代表着我们不仅要对现在的生活有贡献,也要对人类未来的生活进步发展有贡献,构建我们的核心竞争力,成为一家真正伟大的科技公司。
未来,小米将扩大模型规模,不断探索端云结合、多模态融合的大模型解决方案,与小爱同学、MIUI、IoT、机器人、汽车等业务结合,提升小爱同学的理解能力与智能家居指令的识别能力等,给予用户更加个性化的智能体验,按照我们的思路,走出不一样的道路。
本文源自:金融界
标签:
- 西媒:卡斯蒂亚小将贡萨洛可能上调皇马一线队, 此前打进超100球
- 新学期,新气象!绥德县第九小学正式投入使用
- 博奇环保(02377.HK)上半年收入超10亿元 同比增长38.8%
- 惊!这本小说好看到爆,熬夜看到最新一章……
- “国民纯电”东风纳米发布,量子构架3号平台首车纳米01首秀
- 美高校枪击案受害人老师发声
- 安集科技:拟1000万元-2000万元回购股份
- 新湖中宝:上半年权益销售金额11.77亿元,新增土储10.06万平方米
- 华银电力:拟投资86.34亿元建设大唐华银株洲2×100万千瓦扩能升级改造项目
- 受台风“苏拉”影响,南沙天后宫景区暂时闭园
- 南昌市市场监督管理局发布食品抽检信息通告(2023年第30号)
- 为悼念亡父,乌克兰姐妹在墓地热舞,引发众怒或将面临五年监禁
- 2023年中国女士杀菌护理液行业市场全面分析
- 新疆2023年下半年教资成绩公布时间及分数线
- Sonnen公司在德国部署的电池储能系统达到250MWh,预计未来几年达到1GWh
- 62岁乔治·克鲁尼现身威尼斯,45岁魅力妻子相伴,毫无赘肉靓丽惹眼
- 头皮上的牛皮肤癣怎样*
- 美元兑印度卢比汇率走势分析:卢比突破82.50 关注印度GDP和美国非农就业数据
- 《自贸佳》三周年活动海口举行 探讨海南自贸港高质量发展之策
- 偶有阵雨,气温回升!
- 莫维斯理论(关于莫维斯理论简述)
- 优化服务举措、助推融合发展,武汉广告业市场主体明显增加
- 中国新任驻哥伦比亚大使朱京阳抵哥履新
- 全力减损 北京门头沟区积极恢复山区“林花”经济
- 傍大牌销售“复合肥” 一审判刑7年
- 中信建投:中国房地产市场有望进入偏重运营、龙头为王的高质量发展阶段
- 8月30日河南宝鑫聚合氯化铝价格平稳
- 费列罗任命中国区新主帅,迎来首位本土掌舵人
- 工商银行阿克苏分行开展“工行驿站·盛夏关爱三重奏”系列主题活动
- 在审项目触发限制条件咋办?监管再融资收紧引关注 银行券商遇难题
- 9月5日起国内航线燃油附加费上调,最高110元
- 艺术 | 第二届“袁崇焕杯”全国书法大赛作品展开幕
- 中概股指数涨近3%
- 中国电建与中国建科签署战略合作框架协议
- 意马国际(00585)公布中期业绩 拥有人应占溢利406.4万港元 同比减少75.55%
- 利润最大化作为企业财务管理目标的合理性和局限性 简述利润最大化作为企业财务管理目标的合理性及局限性
- 专访3M全球资深副总裁兼中国总裁丁泓禹:可持续发展需要产业链合作
- 从14800元/平方米到19000元/平方米 长沙房价限价创新高释放积极信号
- 小姐姐的出片利器 一张图带你看懂OPPO Find N3 Flip
- 怎么算我到底欠信用卡多少本金-怎么算我到底欠信用卡多少本金呢
- 郑州成人用品进货来源去哪里进(郑州市成人用品批发市场在哪里)
- 图片报:帕利尼亚成拜仁引援优先事项,他们已送出报价
- 再见篮网!斯通5换1报价本-西蒙斯,范弗里特首发位置不保?
- 莫泰168连锁旅店 上海吴中路店(关于莫泰168连锁旅店 上海吴中路店简述)
- 每日钢市:期螺涨破3700,钢价静待需求回暖
- 重庆:企业进军营 助力退役军人再就业
- 胖人发型图片男_胖人发型男
- 费列罗任命中国区新主帅,迎来首位本土掌舵人
- 国网重庆物资公司荣获2023年全国QC成果发布专业级成果
- 山东海阳:“核风光氢储”全面起势,“星箭弹船器”逐梦苍穹
- 长城汽车(601633.SH)半年报净利润13.61亿元,同比下降75.69%
- 浙江台州市路桥区民房发生火灾,致6人死亡
- 研学旅行如何才能行稳致远
- 捷成科创2023年上半年净利-224.34万 亏损减少15.86%
- 坤哥爆料:任天堂将推出新款马里奥限定NS OLED
- 兰考县民族乐器产业园二期项目开工仪式举行
- A股午评:创业板指涨超3% 机器人、汽车零部件板块掀涨停潮
- 存量房贷利率调整,又有大消息!
- 2023全国广播电视和网络视听先进事迹报告会
- 墙体超过几米设置构造柱(墙体超过几米加构造柱)
- 云南省保山市2023-08-30 16:57发布地质灾害橙色预警
- 恐怖黎明(隐藏之路入口位置一览及隐藏之路入口在哪)
- 亚光股份(603282.SH)半年报扣非净利润升38.94%至8097.09万元,拟10派3元
- 宠物龟在美国引起传染疾病 卫生部门建议“不要亲吻或依偎乌龟”
- 大江东|走过五年的上海金融法院,其实与你我很近
- 新鸿基公司8月30日回购1.00万股 耗资2.85万港币
- 人民日报点赞济宁嘉祥:议事解民忧 诉求得回应
- ST澄星: 江苏澄星磷化工股份有限公司董事会审计委员会年报工作规程
- 超大屏画质奇迹 !TCL 115吋 QD-Mini LED 电视成豪宅顶配
- 抢到了吗?华为Mate 60 Pro第一个系统更新推送
- 《海豚湾恋人》童星通缉照曝光!
- 建发房产新中式精品系产品“缦云”落户观音桥
- 亚威股份:公司控股、参股、联营及合营企业具体情况请详见公司定期报告
- 沃尔玛扩大无人机送货范围,打造空中物流网络
- 中国铁建上半年营收5410.6亿 房地产开发业务录得收入214.11亿
- 银行即将开始房贷利率调整,对经济和股市会产生影响吗?
- 深圳公积金租房提取额度是多少 深圳公积金灵活缴存账户租房能提取吗?
- 京东下调包邮门槛带动蛋奶销售额增长近3成 达达快送扩大骑手招募保障“小时达”
- 人心太假太虚伪的短句 人心太假太虚伪的名言警句
- 羊和马属相合不合婚姻,羊和马属相结婚合吗
- 卢克-肖伤缺时间将延长 霍伊伦有望下周出战阿森纳
- 意媒:鲁加尼有望和尤文续约至2026年,总监吉恩托利愿提供新合同
- 中物联:1-7月全国社会物流总额189.9万亿元,同比增长4.7%
- 中国驻加蓬大使:目前当地局势总体稳定
- 英媒猜测:有迹象表明,美国准备重新在英部署战术核武器
- 数据中看经济 物流运行延续平稳恢复势头
- 浙商沪杭甬REIT上半年收入3.58亿元 净利润2650.62万元
- 理想汽车高开近4% 8月销量持续领跑新势力
- 苹果手机还原是什么意思
- 最新通报!山东德州1人被查
- 中国平安联席首席执行官直言股价被低估
- 安全资金投入计划
- 中超联赛有限责任公司董事长刘军被查
- 中超联赛有限责任公司董事长刘军接受审查调查
- 财政部:妥善化解存量隐性债务,稳步推进地方政府债务合并监管
- 中超联赛有限责任公司董事长刘军接受审查调查
- 河南范县:精心准备迎开学
- 南昌将在老官洲举办迎春烟花晚会
- 探秘“中国天眼”,伊利的这次研学之旅“含星量”太高
- 中超联赛有限责任公司董事长刘军接受审查调查