123悬赏网_发布悬赏任务_广告任务平台

首頁 > 活動(dòng)線報(bào) > 每日福利 > 如何定義一款新的AI處理器?AI芯片案例分析

如何定義一款新的AI處理器?AI芯片案例分析

發(fā)布時(shí)間:2024-10-20 22:09:38來源: 13041198719
AI大模型的熱潮不斷,預(yù)計(jì)未來十年,AGI時(shí)代即將到來。但目前支撐AI發(fā)展的GPU和AI專用芯片,都存在各種各樣的問題。 那么,在分析這些問題的基礎(chǔ)上,我們能不能針對(duì)這些問題進(jìn)行優(yōu)化,重新定義一款能夠支持未來十年AGI大模型的、足夠靈活通用的、效率極高性能數(shù)量級(jí)提升的、單位算力成本非常低廉的、新的AI處理器類型?
 
01.首先分析場(chǎng)景特點(diǎn),做好軟硬件劃分
 
1.1 一方面,AI處理器存在問題
 
差不多是從2015年前后,開始興起了專用AI芯片的浪潮。以谷歌TPU為典型代表的各種架構(gòu)的AI專用芯片,如雨后春筍般涌現(xiàn)。 但從AI落地情況來看,效果并不是很理想。這里的主要問題在于:
 
AI芯片專用設(shè)計(jì),把許多業(yè)務(wù)邏輯沉到硬件里,跟業(yè)務(wù)緊密耦合;但業(yè)務(wù)變化太快,算法不斷更新,芯片和業(yè)務(wù)的匹配度很低。
 
AI算法是專用的,面向具體場(chǎng)景,比如人臉識(shí)別、車牌識(shí)別,各種物品識(shí)別等。綜合來看,算法有上千種,加上算法自身仍在快速演進(jìn),加上各種變種的算法甚至超過數(shù)萬種。
 
用戶的業(yè)務(wù)場(chǎng)景是綜合性的,把業(yè)務(wù)場(chǎng)景比做一桌宴席,AI芯片就是主打的那道主菜。對(duì)AI芯片公司來說,自己只擅長(zhǎng)做這一道菜,并不擅長(zhǎng)做其他的菜品,更不擅長(zhǎng)幫助用戶搭配一桌美味可口、葷素均衡、營(yíng)養(yǎng)均衡的宴席。
 
1.2 另一方面,GPU也存在問題
 
NVIDIA的GPU是通用并行處理器:
 
性能效率相對(duì)不高,性能逐漸見頂。要想算力提升,只能通過提升集群規(guī)模(Scale Out,增加GPU數(shù)量)的方式。
 
增加集群規(guī)模,受限于I/O的帶寬和延遲。一方面,集群的網(wǎng)絡(luò)連接數(shù)量為O(n^2),連接數(shù)量隨著集群規(guī)模的指數(shù)級(jí)增加;另一方面,AI類的計(jì)算任務(wù),不同節(jié)點(diǎn)間的數(shù)據(jù)交互本身就非常巨大。因此,受阿姆達(dá)爾定律影響,I/O的帶寬和延遲,會(huì)約束集群規(guī)模的大小。(在保證集群交互效率的情況下,)目前能支持的集群規(guī)模大約在1500臺(tái)左右。
 
還有另外一個(gè)強(qiáng)約束,就是成本。據(jù)稱GPT5需要5萬張GPU卡,單卡的成本在5W美金左右,再加上其他硬件和基礎(chǔ)設(shè)施已經(jīng)運(yùn)營(yíng)的成本。僅硬件開銷接近50億美金,即350億RMB。這對(duì)很多廠家來說,是天文數(shù)字。
 
1.3 問題的核心:芯片的靈活性要匹配場(chǎng)景的靈活性
 
首先,仍然是從我們之前很多文章中提到的這個(gè)“從軟件到硬件的典型處理器劃分圖”開始分析。
 
 
 
指令是處理器軟件和硬件的媒介:有的指令非常簡(jiǎn)單,就是基本的加減乘除等標(biāo)量計(jì)算;有的指令非常復(fù)雜,不是純粹的向量、矩陣或多維張量計(jì)算,而是各種維度計(jì)算再組合的一個(gè)混合的宏指令,或者說是一個(gè)算子甚至算法,就對(duì)應(yīng)到一條(單位計(jì)算)指令。 AI專用處理器是一種DSA,是在ASIC基礎(chǔ)上具有一定的可編程能力。性能效率足夠好,但不夠靈活,不太適合業(yè)務(wù)邏輯和算法快速變化的AI場(chǎng)景。而GPU足夠靈活,但性能效率不夠,并且性能逐漸達(dá)到上限。 從目前大模型宏觀發(fā)展趨勢(shì)來看:
 
Transformer會(huì)是核心算法,在大模型上已經(jīng)顯露威力。未來模型的底層算法/算子會(huì)逐漸統(tǒng)一于Transformer或某個(gè)類Transformer的算法。從此趨勢(shì)分析可得:AI場(chǎng)景的業(yè)務(wù)邏輯和算法在逐漸收斂,其靈活性在逐漸降低。
 
此外,AI計(jì)算框架也走過了百家爭(zhēng)鳴的階段,目前可以看到的趨勢(shì)是,PyTorch占據(jù)了絕大部分份額。這說明整個(gè)生態(tài)也在逐漸收斂,整個(gè)系統(tǒng)的迭代也在放慢。
 
這兩個(gè)趨勢(shì)都說明了,未來,“專用”的AI芯片會(huì)逐漸地綻放光芒。當(dāng)然了,作為AI芯片的公司,不能等,而是需要相向而行:
 
需要定義一款,其性能/靈活性特征介于GPU和目前傳統(tǒng)AI-DSA處理器之間的,新型的通用AI處理器。“比GPU更高效,比AI芯片更通用”。
 
通用性體現(xiàn)在兩個(gè)方面:
 
一方面,處理器的通用性。能夠適配更多的算法差異性和算法迭代,覆蓋更多場(chǎng)景和更長(zhǎng)的生命周期。
 
另一方面,面向AGI通用人工智能。不再是專用AI的“場(chǎng)景千千萬,處理器千千萬”,架構(gòu)和生態(tài)完全碎片;而是一個(gè)通用的強(qiáng)人工智能算法,一個(gè)通用的強(qiáng)處理器平臺(tái),去強(qiáng)智能化的適配各種場(chǎng)景。
 
02.大核少核 or 小核眾核?
 
 
 
CPU是大核,但通常一個(gè)芯片里只有不到100個(gè)物理核心;而GPU是小核眾核的實(shí)現(xiàn),目前通常在上萬個(gè)核左右;而傳統(tǒng)AI芯片,通常是大的定制核+相對(duì)少量核(100核以內(nèi))的并行。
 
 
 
此外,一個(gè)很重要的現(xiàn)象是,GPU核,不再是之前只有CUDA核的標(biāo)量處理器,而是增加了很多Tensor核的類協(xié)處理器的部分。新的GPU處理器不再在處理器核的數(shù)量上增加,反而把寶貴的晶體管資源用在單個(gè)核的協(xié)處理器上,把單核的能力做更多的強(qiáng)化。 因此,新型通用AI芯片需要:
 
在目前工藝情況下,并行的單芯片處理器核心(GA,通用AI處理器核心)數(shù)量在500-1000之間比較合適;
 
單個(gè)GA采用通用高效能CPU核(例如定制的RISC-v CPU)+強(qiáng)大的Tensor協(xié)處理器的方式。
 
03.極致擴(kuò)展性,多層次強(qiáng)化內(nèi)聯(lián)交互
 

每日福利更多>>

從SUV王者到越野專家,長(zhǎng)城把″聚焦″這個(gè)方法論貫徹始終 國(guó)產(chǎn)煥新Model Y 或是特斯拉5月份澳大利亞銷量主要來源 小桔充電與比亞迪達(dá)成戰(zhàn)略合作 共建超充網(wǎng)絡(luò)開放生態(tài) 一汽奧迪Q6L e-tron:讓華為智駕有“德味”,比“堆料”更懂本質(zhì) 蔚來精細(xì)化管理研發(fā)投入:CBU機(jī)制推行后,非必要研發(fā)項(xiàng)目不予立項(xiàng) 蘋果iPhone 13 5G手機(jī)128GB午夜色到手價(jià)1584元 多彩小直屏vivo S30系列發(fā)布 官方稱vivo X Fold5 將打破 X Fold3最輕記錄 榮耀 Earbuds 4i 耳機(jī)首銷:50dB 降噪、11mm 鍍鈦低音單元,249 元 帕沃森摸魚戰(zhàn)士手機(jī)殼限時(shí)特惠9.1元 榮耀進(jìn)軍機(jī)器人!手機(jī)廠商扎堆機(jī)器人賽道 環(huán)球、華納和索尼音樂正與兩初創(chuàng)公司磋商AI音樂權(quán)限 小米618推出線下主題科技展,國(guó)內(nèi)首款自主研發(fā)3 nm旗艦亮相展出 東風(fēng)汽車賀琳曼詳解車載光通信的技術(shù)研究與應(yīng)用實(shí)踐 大眾報(bào)業(yè)集團(tuán)駐地媒體聯(lián)合采訪團(tuán)走進(jìn)山東鳳凰制藥股份有限公司 滬深兩市今日成交額合計(jì)1.19萬億,比亞迪成交額居首 吉利集團(tuán)旗下電池公司吉曜通行:預(yù)計(jì)到2027年形成70GWh電池產(chǎn)能規(guī)模 2025款長(zhǎng)安UNI-Z上市,燃油版11.59萬起、PHEV版12.69萬起 阿電入烏儲(chǔ)能采購(gòu)開標(biāo):0.46-0.58元/Wh,構(gòu)網(wǎng)型600MWh,比亞迪最低,陽光最高 日系車質(zhì)量投訴霸榜,一汽豐田“開不壞”神話破滅了? 小鵬MONA發(fā)布會(huì)變身車友派對(duì),歐陽娜娜亮相何小鵬信心十足 16個(gè)區(qū)全覆蓋!蔚來能源實(shí)現(xiàn)天津換電縣縣通 限時(shí)先享價(jià)7.99萬元起,“國(guó)民智趣純電SUV”東風(fēng)納米06正式上市! 35.99萬-40.99萬!乾崑智駕奢享旗艦MPV,傳祺向往M8乾崑正式上市 10萬級(jí)純電家轎,610km續(xù)航+2C快充,試駕五菱星光EV 3000億!長(zhǎng)安汽車董事長(zhǎng)朱華榮定下今年銷量目標(biāo),不會(huì)因重組改變既定戰(zhàn)略 比亞迪打響價(jià)格戰(zhàn)!比亞迪海豹06DM-i旅行版是否為務(wù)實(shí)之選? 2025款釔為3 VS 埃安UT,誰更值得選購(gòu)? 比亞迪成為CCTV科技強(qiáng)國(guó)戰(zhàn)略合作伙伴 EQB對(duì)L6,一個(gè)奔馳“圖騰”,一個(gè)理想“家庭戰(zhàn)車”,選哪個(gè)?
主站蜘蛛池模板: 无锡装修装潢公司,口碑好的装饰装修公司-无锡索美装饰设计工程有限公司 | 工控机-图像采集卡-PoE网卡-人工智能-工业主板-深圳朗锐智科 | 深圳市八百通智能技术有限公司官方网站 | 电线电缆厂家|沈阳电缆厂|电线厂|沈阳英联塑力线缆有限公司 | 胶水,胶粘剂,AB胶,环氧胶,UV胶水,高温胶,快干胶,密封胶,结构胶,电子胶,厌氧胶,高温胶水,电子胶水-东莞聚力-聚厉胶粘 | 中医中药治疗血小板减少-石家庄血液病肿瘤门诊部 | 高低温试验箱-模拟高低温试验箱订制-北京普桑达仪器科技有限公司【官网】 | 真空泵维修保养,普发,阿尔卡特,荏原,卡西亚玛,莱宝,爱德华干式螺杆真空泵维修-东莞比其尔真空机电设备有限公司 | 家乐事净水器官网-净水器厂家「官方」 | 电缆隧道在线监测-智慧配电站房-升压站在线监测-江苏久创电气科技有限公司 | 隧道窑炉,隧道窑炉厂家-山东艾瑶国际贸易 | BESWICK球阀,BESWICK接头,BURKERT膜片阀,美国SEL继电器-东莞市广联自动化科技有限公司 | 上海办公室装修,写字楼装修—启鸣装饰设计工程有限公司 | 便携式谷丙转氨酶检测仪|华图生物科技百科 | 魔方网-培训咨询服务平台| 防爆电机生产厂家,YBK3电动机,YBX3系列防爆电机,YBX4节防爆电机--河南省南洋防爆电机有限公司 | 活动策划,舞台搭建,活动策划公司-首选美湖上海活动策划公司 | 乐之康护 - 专业护工服务平台,提供医院陪护-居家照护-居家康复 | 不发火防静电金属骨料_无机磨石_水泥自流平_修补砂浆厂家「圣威特」 | 百方网-百方电气网,电工电气行业专业的B2B电子商务平台 | 德国BOSCH电磁阀-德国HERION电磁阀-JOUCOMATIC电磁阀|乾拓百科 | 预制围墙_工程预制围墙_天津市瑞通建筑材料有限公司 | 传动滚筒,改向滚筒-淄博建凯机械科技有限公司 | 磨煤机配件-高铬辊套-高铬衬板-立磨辊套-盐山县宏润电力设备有限公司 | 鄂泉泵业官网|(杭州、上海、全国畅销)大流量防汛排涝泵-LW立式排污泵 | 合肥触摸一体机_触摸查询机厂家_合肥拼接屏-安徽迅博智能科技 | 膏方加工_丸剂贴牌_膏滋代加工_湖北康瑞生物科技有限公司 | 开业庆典_舞龙舞狮_乔迁奠基仪式_开工仪式-神挚龙狮鼓乐文化传媒 | 天津蒸汽/热水锅炉-电锅炉安装维修直销厂家-天津鑫淼暖通设备有限公司 | 天津货架厂_穿梭车货架_重型仓储货架_阁楼货架定制-天津钢力仓储货架生产厂家_天津钢力智能仓储装备 | 蓝牙音频分析仪-多功能-四通道-八通道音频分析仪-东莞市奥普新音频技术有限公司 | 郑州爱婴幼师学校_专业幼师培训_托育师培训_幼儿教育培训学校 | 课件导航网_ppt课件_课件模板_课件下载_最新课件资源分享发布平台 | 广西绿桂涂料--承接隔热涂料、隔音涂料、真石漆、多彩仿石漆等涂料工程双包施工 | 济南货架定做_仓储货架生产厂_重型货架厂_仓库货架批发_济南启力仓储设备有限公司 | 撕碎机_轮胎破碎机_粉碎机_回收生产线厂家_东莞华达机械有限公司 | 飞歌臭氧发生器厂家_水处理臭氧发生器_十大臭氧消毒机品牌 | 聚天冬氨酸,亚氨基二琥珀酸四钠,PASP,IDS - 远联化工 | 【甲方装饰】合肥工装公司-合肥装修设计公司,专业从事安徽办公室、店面、售楼部、餐饮店、厂房装修设计服务 | 成都租车_成都租车公司_成都租车网_众行宝 | 拉力机-拉力试验机-万能试验机-电子拉力机-拉伸试验机-剥离强度试验机-苏州皖仪实验仪器有限公司 |