123悬赏网_发布悬赏任务_广告任务平台

首頁 > 生活分享 > 免費教學 > 微軟發布Phi-3 Mini:3.8B參數小到能塞進手機,性能媲美GPT-3.5

微軟發布Phi-3 Mini:3.8B參數小到能塞進手機,性能媲美GPT-3.5

發布時間:2024-04-24 22:46:37來源: 15210273549

 

編譯 | 長頸鹿
編輯 | 香草

智東西4月24日報道,4月23日,微軟在官網開源了小語言模型(SLM)——Phi-3-mini。這是微軟Phi-3系列模型推出的首個模型。

Phi-3-mini作為微軟Phi系列的第四代產品,以其38億參數和3.3T tokens的龐大訓練數據量,在語言、推理、編碼和數學基準測試中超越了眾多數百億參數規模的模型。

此外,Phi-3-mini有4k和128k tokens兩個上下文長度變體,經過預訓練和指令調整,可以更好地理解人類的語言、表達、邏輯并執行不同類型的指令。

與大語言模型相比,Phi-3-mini模型操作更為簡便。該模型的體積很小,這一特性使其可以在端側部署和運行。據稱,該模型可以作為聊天機器人離線訪問,且具有不亞于GPT-3.5的性能。

Phi-3-mini的成本大幅降低。微軟生成式AI研究副總裁塞巴斯蒂安·布貝克(Sébastien Bubeck)稱,相比于其他相似功能的模型,Phi-3-mini成本可能只有十分之一。

據微軟研究團隊稱,Phi-3-mini小體積、高性能的創新歸功于由合成數據組成的數據集。該數據集由大量已過濾的網絡數據和其他AI制作的兒童讀物中的合成數據組成。

微軟計劃在未來幾周內推出Phi-3系列的另外兩個模型,分別是Phi-3-small(7B)和Phi-3-medium(14B)。

目前有三個平臺可以獲取Phi-3-mini:

Microsoft Azure AI Studio:https://ai.azure.com/explore/models/Phi-3-mini-128k-instruct/version/2/registry/azureml

Hugging Face:https://huggingface.co/collections/microsoft/phi-3-6626e15e9585a200d2d761e3

Ollama:https://ollama.com/library/phi3

一、“小而美”的模型,Phi-3-mini優于兩倍其尺寸模型

據微軟官網稱,Phi-3模型是目前能力最強、性價比最高的小型語言模型(SLM),其在多種語言、推理、編碼和數學基準測試中均展現出超越同等規模甚至更大型模型的能力。

Phi-3-mini包含兩種上下文長度的規模,分別是4k和128k tokens,其中128k tokens的上下文窗口支持在同類模型是首次實現,且對模型質量的影響微乎其微。此外,該模型經過指令微調,能夠以自然語言方式響應和執行多種指令,確保了其即時可用性。

Phi-3模型在小尺寸上具有突破性的性能。根據微軟研發團隊的測試,Phi-3模型在基準測試中優于相同尺寸和更大尺寸的語言模型。其中,Phi-3-mini的性能優于其尺寸兩倍的模型,而Phi-3-small和Phi-3-medium的性能優于更大的模型,包括GPT-3.5 Turbo。

根據性能對照表,Phi-3-mini的兩個變體于基準測試的19個對比項中,有17項勝過Gemma-7b模型,18項勝過Mistral-7b模型,11項勝過Llama-3-8B模型。但也有11項次于GPT3.5-Turbo模型,17項次于Claude-3 Sonnet模型。

 

▲Phi-3系列基準測試對照表(圖源:微軟)

此外,微軟還在學術報告中稱Phi-3模型的整體性能可以與Mixtral 8x7B和GPT-3.5等模型相媲美。

Phi系列模型的起源于微軟研究部門,已經被廣泛使用,其中Phi-2下載量超過200萬次。從用于Python編碼的Phi-1開始,到增強推理和理解的Phi-1.5,再到27億參數的Phi-2,Phi系列在語言理解方面超越了其25倍參數大小的模型。

微軟計劃在未來幾周內推出Phi-3系列的另外兩個模型,分別是Phi-3-small(7B)和Phi-3-medium(14B),旨在為Azure AI和其他模型庫提供更靈活的選擇。

二、Phi-3遵循安全和高質,Phi-3-mini為多個平臺專門優化

Phi-3模型的設計遵循了微軟的“負責任AI標準”,包括問責制、透明度、公平性、可靠性與安全性、隱私與安全和包容性。Phi-3模型經歷了嚴格的安全度量和評估、紅隊測試、敏感用途審查,并遵循安全指南,以確保這些模型在開發、測試和部署過程中都符合微軟的標準和最佳實踐。

Phi-3模型在訓練過程中采用了高質量的數據,這是基于先前的Phi模型工作的延續。它們還通過了廣泛的安全后訓練,包括從人類反饋中進行的強化學習(RLHF)、在數十個傷害類別上進行的自動測試和手動紅隊測試。

此外,Phi-3-mini在Azure AI上配備了一套完整的部署、評估和微調工具鏈,并通過Ollama平臺使開發者能夠在本地筆記本電腦上運行。模型還針對ONNX Runtime進行了優化,支持Windows DirectML,并且實現了跨平臺支持,包括GPU、CPU和移動硬件。

同時,Phi-3-mini也作為英偉達推理微服務(NVIDIA NIM)提供,具備可廣泛部署的標準API接口,并對英偉達GPU進行了專門優化。

三、Phi-3提供離線推理場景,AI解決方案已落地印度

微軟公司通過提供Copilots幫助客戶用生成式AI進行業務轉型。他們認為,不同任務對質量成本曲線上不同規模模型的需求正日益增長。

小語言模型,如Phi-3,特別適用于以下情況:資源受限的環境,包括設備上和離線推理場景;延遲約束的場景,快速響應時間至關重要;以及成本受限的用例,特別是那些具有較簡單任務的用例。

由于尺寸較小,Phi-3模型可以在計算受限的推理環境中使用,特別是Phi-3-mini可以在端側使用。Phi-3模型的較小尺寸還使得微調或定制變得更加容易和更具成本效益。此外,較低的計算需求使其成本更低,延遲更好。較長的上下文窗口使其能夠處理和推理大量的文本內容,如文檔、網頁、代碼等。

微軟的一些客戶已經開始使用Phi-3構建解決方案。比如農業領域,Phi-3模型為農民提供了更便捷、更經濟的解決方案,并幫助他們在沒有穩定互聯網連接的情況下使用AI技術。

印度一家領先的商業集團ITC正在將Phi-3模型用于Krishi Mitra(一款面向農民的應用程序)內,幫助印度農民通過技術手段獲得更好的農業解決方案。據悉,該應用已經覆蓋了超過一百萬名農民。

結語:大小模型相輔相成,離線AI聊天已成現實

微軟的Phi-3模型設計的初衷旨在兼容多種設備。Phi-3與Stability AI的Zephyr、谷歌的Gemini Nano和Anthropic的Claude 3 Haiku等小型模型一樣,能夠在端側運行,而無需依賴互聯網連接。

盡管云端大模型在性能上全面超越小模型,但它們也存在一些局限性,包括較高的成本、運行速度以及對互聯網連接的依賴。相比之下,Phi-3允許用戶在沒有網絡的情況下與虛擬助手進行互動,能夠在不上傳數據的前提下實現內容總結,解決了AI領域的一部分弊端。

未來這類模型有望與智能手機集成,甚至可能內置于常用家電中,為用戶的生活提供個性化建議。我們期待AI變得越來越生活化,也期待小語言模型在未來的進步

免費教學更多>>

變革時代共塑未來,2025中國汽車重慶論壇盛大開幕 2025 款馬自達 CX-5 SUV 車型上市:全系 2.0L 動力、新增黑曜選裝包,12.58 萬元起 2026 款沃爾沃 XC60 SUV 車型上市:升級 11.2 英寸懸浮式中控,39.69 萬元起 家庭大六座SUV 深藍S09對比問界M8 S09不是備選是首選! 新央企 新豪華 阿維塔 全球化加速布局 向著年銷80萬臺目標邁進 阿維塔總裁陳卓:真正的世界級品牌都擁有原創設計 第七屆棱鏡MINI戲劇節頒獎晚會北京舉辦 甘肅小劇場戲劇《長相念》獲“青年力量”獎 新款國產起亞賽圖斯將于下半年發布,定位緊湊型SUV 包場寵粉,長安汽車“全家桶”強勢亮相重慶車展 乘勢而上 長安汽車以歷史性發展機遇鑄就全球競爭新優勢 福特全順拆車:賣的就是毛坯,買的也是看中了毛坯! 大眾汽車全面擁抱新勢力,所有電動汽車將基于Rivian R2技術研發 中國品牌巴西逆襲:比亞迪首超豐田位列第四 奇瑞取代日產進入前十 重慶車展|比亞迪海豹06EV上市,售價10.98萬~12.98萬 比亞迪李云飛稱中國汽車出海無內卷,建議設出口門檻 楊學良:吉利永遠不做卷王,永遠不搞內卷式惡性競爭 時隔25年,奧迪再次上演“默片”廣告,小心思震耳欲聾 特斯拉沒造出來的車,小鵬先造出來了 武漢蔚來能源申請光伏儲能系統相關專利,減少能量轉換環節 卓馭(原大疆車載)被曝獲北汽產投與廣汽資本投資,合計數億元 沃爾沃全新S90上市,限時售價30.09萬元起 銀河星耀8擠占插混式榜單第九!2025年第21周純電動/插混/增程式/轎車/SUV/MPV車型TOP10出爐 從SUV王者到越野專家,長城把″聚焦″這個方法論貫徹始終 阿維塔將推百萬級旗艦六座SUV 預計在2026年上市 松下小方盒mini剃須刀暗夜黑超值優惠 長安鎮:人大代表聚力破解“飛線”難題 長安汽車:2025年底將在歐洲拓展至少10個市場 尊界S800上市:沖擊新能源超豪華車“無人區” 擎動未來 逐鹿贛線!東風龍擎快遞快運車型節能賽江西開賽 5月傳統汽車品牌銷量點評,大眾、豐田掉隊,比亞迪、吉利崛起
主站蜘蛛池模板: 辐射色度计-字符亮度测试-反射式膜厚仪-苏州瑞格谱光电科技有限公司 | 烟台游艇培训,威海游艇培训-烟台市邮轮游艇行业协会 | 螺旋丝杆升降机-SWL蜗轮-滚珠丝杆升降机厂家-山东明泰传动机械有限公司 | 聚丙烯酰胺PAM-聚合氯化铝PAC-絮凝剂-河南博旭环保科技有限公司 巨野电机维修-水泵维修-巨野县飞宇机电维修有限公司 | 河北中仪伟创试验仪器有限公司是专业生产沥青,土工,水泥,混凝土等试验仪器的厂家,咨询电话:13373070969 | 电力测功机,电涡流测功机,磁粉制动器,南通远辰曳引机测试台 | 右手官网|右手工业设计|外观设计公司|工业设计公司|产品创新设计|医疗产品结构设计|EMC产品结构设计 | 台湾阳明固态继电器-奥托尼克斯光电传感器-接近开关-温控器-光纤传感器-编码器一级代理商江苏用之宜电气 | 欧盟ce检测认证_reach检测报告_第三方检测中心-深圳市威腾检验技术有限公司 | 金现代信息产业股份有限公司--数字化解决方案供应商 | 双相钢_双相不锈钢_双相钢圆钢棒_双相不锈钢报价「海新双相钢」 双能x射线骨密度检测仪_dxa骨密度仪_双能x线骨密度仪_品牌厂家【品源医疗】 | 西安微信朋友圈广告投放_微信朋友圈推广_西安度娘网络科技有限公司 | 球盟会·(中国)官方网站 | 水厂污泥地磅|污泥处理地磅厂家|地磅无人值守称重系统升级改造|地磅自动称重系统维修-河南成辉电子科技有限公司 | 济南宣传册设计-画册设计_济南莫都品牌设计公司 | 领袖户外_深度旅游、摄影旅游、小团慢旅行、驴友网 | 洗瓶机厂家-酒瓶玻璃瓶冲瓶机-瓶子烘干机-封口旋盖压盖打塞机_青州惠联灌装机械 | 伺服电机维修、驱动器维修「安川|三菱|松下」伺服维修公司-深圳华创益 | 广州物流公司_广州货运公司_广州回程车运输 - 万信物流 | 论文查重_免费论文查重_知网学术不端论文查重检测系统入口_论文查重软件 | 尼龙PA610树脂,尼龙PA612树脂,尼龙PA1010树脂,透明尼龙-谷骐科技【官网】 | 淘气堡_室内儿童乐园_户外无动力儿童游乐设备-高乐迪(北京) | 校园气象站_超声波气象站_农业气象站_雨量监测站_风途科技 | 时代北利离心机,实验室离心机,医用离心机,低速离心机DT5-2,美国SKC采样泵-上海京工实业有限公司 工业电炉,台车式电炉_厂家-淄博申华工业电炉有限公司 | 电磁流量计厂家_涡街流量计厂家_热式气体流量计-青天伟业仪器仪表有限公司 | 宁夏档案密集柜,智能密集柜,电动手摇密集柜-盛隆柜业宁夏档案密集柜厂家 | 植筋胶-粘钢胶-碳纤维布-碳纤维板-环氧砂浆-加固材料生产厂家-上海巧力建筑科技有限公司 | 砂石生产线_石料生产线设备_制砂生产线设备价格_生产厂家-河南中誉鼎力智能装备有限公司 | 耳模扫描仪-定制耳机设计软件-DLP打印机-asiga打印机-fitshape「飞特西普」 | 磁力反应釜,高压釜,实验室反应釜,高温高压反应釜-威海自控反应釜有限公司 | 杜甫仪器官网|实验室平行反应器|升降水浴锅|台式低温循环泵 | 全自动翻转振荡器-浸出式水平振荡器厂家-土壤干燥箱价格-常州普天仪器 | 江苏齐宝进出口贸易有限公司| 丝杆升降机-不锈钢丝杆升降机-非标定制丝杆升降机厂家-山东鑫光减速机有限公司 | 德州网站开发定制-小程序开发制作-APP软件开发-「两山开发」 | 重庆磨床过滤机,重庆纸带过滤机,机床伸缩钣金,重庆机床钣金护罩-重庆达鸿兴精密机械制造有限公司 | 水质监测站_水质在线分析仪_水质自动监测系统_多参数水质在线监测仪_水质传感器-山东万象环境科技有限公司 | 天津拓展_天津团建_天津趣味运动会_天津活动策划公司-天津华天拓展培训中心 | 新材料分散-高速均质搅拌机-超声波分散混合-上海化烁智能设备有限公司 | 成都APP开发-成都App定制-成都app开发公司-【未来久】 | 皮带机_移动皮带机_大倾角皮带机_皮带机厂家 - 新乡市国盛机械设备有限公司 |