白象被指玩文字游戏,“多半袋面”中的“多半”是商标!最新回应
白象被指玩文字游戏,“多半袋面”中的“多半”是商标!最新回应
白象被指玩文字游戏,“多半袋面”中的“多半”是商标!最新回应模型(móxíng)小型化让一些端侧场景用了起来。
“零售场景下,8B(B为十亿参数)模型能做(zuò)人流预测、商品检验、导购(dǎogòu);14B可以做一些简单报表分析;32B在报表出来后还可以给图谱指引、数据预警;70B可以扮演区域经理(qūyùjīnglǐ)、大区经理的角色。” 工控主板厂商吉方(jífāng)工控副总经理李晓涛在近日(jìnrì)一场分享(fēnxiǎng)中表示。他告诉记者,近期有很多模型已能用于公司实际运营中,且性价比高。
在大模型(móxíng)中,8B~70B参数并不算大。记者了解到,对模型小型化和性价比等的重视,让端侧场景(chǎngjǐng)的芯片方案与数据中心有一些(yīxiē)不同。相比数据中心硬件(yìngjiàn)投资向GPU等加速芯片倾斜,端侧小模型对算力的要求不一定很高,在一些情况下,独立GPU不一定是必选项。
零售场景(chǎngjǐng)扩大AI应用
记者了解到,作为端侧场景(chǎngjǐng)之一,零售场景过去几年一直在尝试扩大AI应用。已经落地的(de)AI应用中,最早实现的包括(bāokuò)商品自动识别,随后扩展至AI自助防损等。
据商业软硬件厂商(chǎngshāng)海石商用副总经理李昊旻介绍,零售场景AI落地源于芯片算力冗余,“三四年前,我们就看到算力的(de)应用前景(qiánjǐng),根源在于观察到CPU和GPU性能(xìngnéng)在零售场景开始出现冗余,单纯的算账(suànzhàng)和支付不需要太高的性能。(与此同时)AI场景开始显现出来。”
据李昊旻(mín)介绍,最早被提出并解决的是生鲜识别(shíbié)问题,由摄像头采集生鲜图像并由AI识别、算出SKU(最小存货单位)。如今,一些超市的秤(chèng)能自动识别生鲜,无须(wúxū)人工选择,其他应用还包括AI+通道识别方案、AI团餐识别方案,分别用于识别超市收银是否有(yǒu)异常扫码行为、提高自选菜餐厅的收银效率。
AI自主防损是(shì)一种更新的应用。李昊旻表示,当前零售行业最需要(xūyào)解决的问题包括自助防损,有2%~3%的商品顾客未能成功完成扫描动作。防损算法、ToF传感器可用于判断收银(shōuyín)动作是否(shìfǒu)完成,有80%无意间造成的扫描异常会被识别。
商用(shāngyòng)终端设备和系统(xìtǒng)厂商中科英泰副总经理管建鹏(guǎnjiànpéng)向记者举例,某区域的龙头超市有(yǒu)4台自助收银机,系统识别异常并提醒顾客后,80%的顾客会重新(chóngxīn)扫描商品,超市每日平均止损65次。若消费者不重新扫描,系统会通知超市防损员,人力介入后每日止损约1066元。
不过,零售业AI应用还有一些(yīxiē)难题待解决,例如,李昊旻称,实现生鲜识别后,标准品识别在技术上(zàijìshùshàng)还存在一定难度,业内还在研究。
业内认为大模型将带来助力。英特尔中国网络与(yǔ)边缘(biānyuán)技术产品总监王景佳向记者表示(biǎoshì),以往AI应用基于计算机(jìsuànjī)视觉、卷积(juǎnjī)神经网络技术,现在大模型技术除了可能带来新功能,还能帮助解决一些传统AI应用的难题,例如物品遮挡的情况下以往AI可能无法识别,现在识别效率有所提高。
“1.5B模型只能做简单问答(wèndá),而且反应不够快,容易出错;7B、8B的模型可以做简单的文案生成(shēngchéng)和代码编写,会出现一些错误,但能慢慢(mànmàn)修正;14B有很强的能力(nénglì),可以总结、汇总;32B到70B已经达到普通人无法达到的水平了。”李晓涛称。
今年4月,绝味食品与腾讯智慧(zhìhuì)零售联合发布了中国零售连锁AI垂直大(dà)模型和三个AI应用,可用于与顾客互动、智能排班、库存预测等。去年,天虹股份下属(xiàshǔ)子公司则开发了百灵鸟AI大模型,可用于AI搜索推荐、AI导购(dǎogòu)等。
业内还在展望更(gèng)多应用。“零售行业站在一个变革潮头。当(dāng)走进便利店,你可能会发现便利店里的(de)摄像头不再是简单的安防(ānfáng)工具,而是成为体验(tǐyàn)、消费、情绪的传感器。当货架上的电子价签闪烁,你可能不知道它也在经历一场毫米级的、非常高难度的算力革命,可能正在打价格战。” 中国连锁经营协会副秘书长杨雯表示。
不同(bùtóng)芯片抢夺端侧市场
以零售业为例,从成本等(děng)方面考虑,业内认为参数较小的模型适合端侧应用(yìngyòng)。
李昊旻告诉记者,不太可能在每个门店都部署很大(dà)的大模型,无论是从成本还是功耗考虑(kǎolǜ),都不可行。
端侧不运行大参数(cānshù)模型,就(jiù)不一定要配备十分高端且昂贵的显卡,一些消费级显卡、CPU也可以用。英特尔中国零售行业高级技术经理夏耿告诉记者,合作伙伴在32B模型上的投入比较(bǐjiào)多,这是因为综合考虑部署成本和(hé)应用场景之后,发现32B模型在成本、效率和精准度之间有比较好的平衡(pínghéng)。32B模型的运行可以采用4张(zhāng)A770显卡的方案,如果考虑冗余,该方案在商超(shāngchāo)中可以支持前端36到48台设备,整机成本在4万元~5万元之间。
李晓涛告诉记者,如果是14B模型用(yòng)上显卡,成本基本上能做到万元级别(jíbié),该公司(gōngsī)用英特尔(yīngtèěr)CPU和显卡的方案,“我们内部评估认为,如果现在可以做到万元级别,并服务20个人的公司,这样(zhèyàng)客户就愿意(购买)。” 李晓涛表示,门店级的普通员工一年需要小10万元的成本,而使用智能体,相关成本可以做到万元级别。
在不用(bùyòng)到独立显卡的(de)情况下,夏耿表示,单张酷睿Ultra SoC可(kě)以支持14B大模型,单SoC每秒可产生12个token。此前英特尔的芯片已经进行了AI计算重构,去年发布的酷睿Ultra有NPU(神经网络计算单元)结构,可做(zuò)AI加速处理(chǔlǐ)。李晓涛则告诉记者,如果不用显卡,一些情况下CPU能直接(zhíjiē)运行7B、8B的模型。
业内还在展望端侧芯片算力(suànlì)继续提高。李昊旻表示(biǎoshì),端侧设备需要部署足够多的AI功能,并降低对网络的依赖性,从算力支撑看,端侧AI算力会(huì)越来越大。
CPU制程演进(yǎnjìn)已在推进。记者从英特尔了解到(dào),Intel 18A制程已进入风险试产阶段,将于(yú)今年第四季度(dìsìjìdù)首度量产,Intel 14A则计划(jìhuà)在2027年进行风险试产。夏耿表示,采用Intel 18A工艺的(de)Panther Lake处理器推出后,搭载Panther Lake的POS机将不仅能运行(yùnxíng)收银ERP系统和交互界面,还能通过摄像头等传感器接入店铺数据,用AI算法分析客流,下一步还能在POS机上运行大模型,实现(shíxiàn)数字导购助手的功能。
从端侧的芯片(xīnpiàn)组成看,市场研究机构IDC中国副总裁周震刚告诉记者,未来在端侧推理方面,CPU会有很大的进步,但端侧究竟是以CPU为主(wéizhǔ),还是以CPU加协处理器为主,例如(lìrú)CPU+GPU或其他处理器,现在还没有很好的定论,“毕竟终端情况复杂。PC端可能是英特尔(yīngtèěr)和AMD主导,端侧手机、车载则(zé)比较复杂。”
即便都是CPU,在一些端侧AI场景中,CPU架构的组成也较为多元。以笔记本电脑为例(wèilì),目前还是x86架构的CPU较为主流。集邦(jíbāng)分析师(fēnxīshī)黄淑芳表示,不同CPU制造商的AI发展脉络不同,预计发展最快的是微软+x86(英特尔和AMD)的阵营,传统CPU巨头的市场(shìchǎng)资源较多,多数人则(rénzé)熟悉微软系统,预计该阵营AI渗透较快。Arm阵营(包括苹果、高通等)短期还需(xū)接受市场考验,但有机会(jīhuì)快速成长。
“未来几年不同(bùtóng)CPU制造商(zhìzàoshāng)的市场占有(yǒu)率将会发生变化。AI兴起让(ràng)大家对终端省电有所期待,比较期待Arm的功耗表现。随着Windows on Arm组合(zǔhé)的生态越来越成熟、AI应用越来越丰富,2029年基于Arm架构的笔记本电脑预计将有接近40%的市场份额。”黄淑芳表示。
(本文来自第一财经(cáijīng))
模型(móxíng)小型化让一些端侧场景用了起来。
“零售场景下,8B(B为十亿参数)模型能做(zuò)人流预测、商品检验、导购(dǎogòu);14B可以做一些简单报表分析;32B在报表出来后还可以给图谱指引、数据预警;70B可以扮演区域经理(qūyùjīnglǐ)、大区经理的角色。” 工控主板厂商吉方(jífāng)工控副总经理李晓涛在近日(jìnrì)一场分享(fēnxiǎng)中表示。他告诉记者,近期有很多模型已能用于公司实际运营中,且性价比高。
在大模型(móxíng)中,8B~70B参数并不算大。记者了解到,对模型小型化和性价比等的重视,让端侧场景(chǎngjǐng)的芯片方案与数据中心有一些(yīxiē)不同。相比数据中心硬件(yìngjiàn)投资向GPU等加速芯片倾斜,端侧小模型对算力的要求不一定很高,在一些情况下,独立GPU不一定是必选项。
零售场景(chǎngjǐng)扩大AI应用
记者了解到,作为端侧场景(chǎngjǐng)之一,零售场景过去几年一直在尝试扩大AI应用。已经落地的(de)AI应用中,最早实现的包括(bāokuò)商品自动识别,随后扩展至AI自助防损等。
据商业软硬件厂商(chǎngshāng)海石商用副总经理李昊旻介绍,零售场景AI落地源于芯片算力冗余,“三四年前,我们就看到算力的(de)应用前景(qiánjǐng),根源在于观察到CPU和GPU性能(xìngnéng)在零售场景开始出现冗余,单纯的算账(suànzhàng)和支付不需要太高的性能。(与此同时)AI场景开始显现出来。”
据李昊旻(mín)介绍,最早被提出并解决的是生鲜识别(shíbié)问题,由摄像头采集生鲜图像并由AI识别、算出SKU(最小存货单位)。如今,一些超市的秤(chèng)能自动识别生鲜,无须(wúxū)人工选择,其他应用还包括AI+通道识别方案、AI团餐识别方案,分别用于识别超市收银是否有(yǒu)异常扫码行为、提高自选菜餐厅的收银效率。
AI自主防损是(shì)一种更新的应用。李昊旻表示,当前零售行业最需要(xūyào)解决的问题包括自助防损,有2%~3%的商品顾客未能成功完成扫描动作。防损算法、ToF传感器可用于判断收银(shōuyín)动作是否(shìfǒu)完成,有80%无意间造成的扫描异常会被识别。
商用(shāngyòng)终端设备和系统(xìtǒng)厂商中科英泰副总经理管建鹏(guǎnjiànpéng)向记者举例,某区域的龙头超市有(yǒu)4台自助收银机,系统识别异常并提醒顾客后,80%的顾客会重新(chóngxīn)扫描商品,超市每日平均止损65次。若消费者不重新扫描,系统会通知超市防损员,人力介入后每日止损约1066元。
不过,零售业AI应用还有一些(yīxiē)难题待解决,例如,李昊旻称,实现生鲜识别后,标准品识别在技术上(zàijìshùshàng)还存在一定难度,业内还在研究。
业内认为大模型将带来助力。英特尔中国网络与(yǔ)边缘(biānyuán)技术产品总监王景佳向记者表示(biǎoshì),以往AI应用基于计算机(jìsuànjī)视觉、卷积(juǎnjī)神经网络技术,现在大模型技术除了可能带来新功能,还能帮助解决一些传统AI应用的难题,例如物品遮挡的情况下以往AI可能无法识别,现在识别效率有所提高。
“1.5B模型只能做简单问答(wèndá),而且反应不够快,容易出错;7B、8B的模型可以做简单的文案生成(shēngchéng)和代码编写,会出现一些错误,但能慢慢(mànmàn)修正;14B有很强的能力(nénglì),可以总结、汇总;32B到70B已经达到普通人无法达到的水平了。”李晓涛称。
今年4月,绝味食品与腾讯智慧(zhìhuì)零售联合发布了中国零售连锁AI垂直大(dà)模型和三个AI应用,可用于与顾客互动、智能排班、库存预测等。去年,天虹股份下属(xiàshǔ)子公司则开发了百灵鸟AI大模型,可用于AI搜索推荐、AI导购(dǎogòu)等。
业内还在展望更(gèng)多应用。“零售行业站在一个变革潮头。当(dāng)走进便利店,你可能会发现便利店里的(de)摄像头不再是简单的安防(ānfáng)工具,而是成为体验(tǐyàn)、消费、情绪的传感器。当货架上的电子价签闪烁,你可能不知道它也在经历一场毫米级的、非常高难度的算力革命,可能正在打价格战。” 中国连锁经营协会副秘书长杨雯表示。
不同(bùtóng)芯片抢夺端侧市场
以零售业为例,从成本等(děng)方面考虑,业内认为参数较小的模型适合端侧应用(yìngyòng)。
李昊旻告诉记者,不太可能在每个门店都部署很大(dà)的大模型,无论是从成本还是功耗考虑(kǎolǜ),都不可行。
端侧不运行大参数(cānshù)模型,就(jiù)不一定要配备十分高端且昂贵的显卡,一些消费级显卡、CPU也可以用。英特尔中国零售行业高级技术经理夏耿告诉记者,合作伙伴在32B模型上的投入比较(bǐjiào)多,这是因为综合考虑部署成本和(hé)应用场景之后,发现32B模型在成本、效率和精准度之间有比较好的平衡(pínghéng)。32B模型的运行可以采用4张(zhāng)A770显卡的方案,如果考虑冗余,该方案在商超(shāngchāo)中可以支持前端36到48台设备,整机成本在4万元~5万元之间。
李晓涛告诉记者,如果是14B模型用(yòng)上显卡,成本基本上能做到万元级别(jíbié),该公司(gōngsī)用英特尔(yīngtèěr)CPU和显卡的方案,“我们内部评估认为,如果现在可以做到万元级别,并服务20个人的公司,这样(zhèyàng)客户就愿意(购买)。” 李晓涛表示,门店级的普通员工一年需要小10万元的成本,而使用智能体,相关成本可以做到万元级别。
在不用(bùyòng)到独立显卡的(de)情况下,夏耿表示,单张酷睿Ultra SoC可(kě)以支持14B大模型,单SoC每秒可产生12个token。此前英特尔的芯片已经进行了AI计算重构,去年发布的酷睿Ultra有NPU(神经网络计算单元)结构,可做(zuò)AI加速处理(chǔlǐ)。李晓涛则告诉记者,如果不用显卡,一些情况下CPU能直接(zhíjiē)运行7B、8B的模型。
业内还在展望端侧芯片算力(suànlì)继续提高。李昊旻表示(biǎoshì),端侧设备需要部署足够多的AI功能,并降低对网络的依赖性,从算力支撑看,端侧AI算力会(huì)越来越大。
CPU制程演进(yǎnjìn)已在推进。记者从英特尔了解到(dào),Intel 18A制程已进入风险试产阶段,将于(yú)今年第四季度(dìsìjìdù)首度量产,Intel 14A则计划(jìhuà)在2027年进行风险试产。夏耿表示,采用Intel 18A工艺的(de)Panther Lake处理器推出后,搭载Panther Lake的POS机将不仅能运行(yùnxíng)收银ERP系统和交互界面,还能通过摄像头等传感器接入店铺数据,用AI算法分析客流,下一步还能在POS机上运行大模型,实现(shíxiàn)数字导购助手的功能。
从端侧的芯片(xīnpiàn)组成看,市场研究机构IDC中国副总裁周震刚告诉记者,未来在端侧推理方面,CPU会有很大的进步,但端侧究竟是以CPU为主(wéizhǔ),还是以CPU加协处理器为主,例如(lìrú)CPU+GPU或其他处理器,现在还没有很好的定论,“毕竟终端情况复杂。PC端可能是英特尔(yīngtèěr)和AMD主导,端侧手机、车载则(zé)比较复杂。”
即便都是CPU,在一些端侧AI场景中,CPU架构的组成也较为多元。以笔记本电脑为例(wèilì),目前还是x86架构的CPU较为主流。集邦(jíbāng)分析师(fēnxīshī)黄淑芳表示,不同CPU制造商的AI发展脉络不同,预计发展最快的是微软+x86(英特尔和AMD)的阵营,传统CPU巨头的市场(shìchǎng)资源较多,多数人则(rénzé)熟悉微软系统,预计该阵营AI渗透较快。Arm阵营(包括苹果、高通等)短期还需(xū)接受市场考验,但有机会(jīhuì)快速成长。
“未来几年不同(bùtóng)CPU制造商(zhìzàoshāng)的市场占有(yǒu)率将会发生变化。AI兴起让(ràng)大家对终端省电有所期待,比较期待Arm的功耗表现。随着Windows on Arm组合(zǔhé)的生态越来越成熟、AI应用越来越丰富,2029年基于Arm架构的笔记本电脑预计将有接近40%的市场份额。”黄淑芳表示。
(本文来自第一财经(cáijīng))



相关推荐
评论列表
暂无评论,快抢沙发吧~
你 发表评论:
欢迎