123悬赏网_发布悬赏任务_广告任务平台

首頁 > 生活分享 > 免費(fèi)教學(xué) > OpenAI 發(fā)布 o1-mini : 更經(jīng)濟(jì)高效的推理模型 | LibreOffice 24.8.1 發(fā)布

OpenAI 發(fā)布 o1-mini : 更經(jīng)濟(jì)高效的推理模型 | LibreOffice 24.8.1 發(fā)布

發(fā)布時間:2024-09-16 16:27:04

OpenAI 發(fā)布 o1-mini:更經(jīng)濟(jì)高效的推理模型

OpenAI 推出 o1-mini,一款專注于 STEM 領(lǐng)域的經(jīng)濟(jì)高效推理模型。o1-mini 在數(shù)學(xué)和編碼方面表現(xiàn)出色,接近 OpenAI o1 的水平,同時成本更低,速度更快。

一、o1-mini 簡介

  • OpenAI o1-mini 是一款專注于 STEM 領(lǐng)域的經(jīng)濟(jì)高效推理模型,尤其擅長數(shù)學(xué)和編碼。
  • o1-mini 在 AIME 和 Codeforces 等評估基準(zhǔn)測試中接近 OpenAI o1 的性能。
  • o1-mini 比 OpenAI o1-preview 便宜 80%,并且延遲更低,速率限制更高。

二、o1-mini 的優(yōu)勢

  • STEM 領(lǐng)域推理能力強(qiáng) :o1-mini 經(jīng)過專門優(yōu)化,在 STEM 領(lǐng)域表現(xiàn)出色,尤其在數(shù)學(xué)和編碼方面。
  • 成本效益高 :o1-mini 比大型語言模型更小,因此運(yùn)行成本更低,更適合實際應(yīng)用。
  • 速度更快 :o1-mini 的響應(yīng)速度比大型語言模型更快,例如在單詞推理問題上比 GPT-4o 快 3-5 倍。

三、o1-mini 的性能表現(xiàn)

領(lǐng)域

基準(zhǔn)測試

o1-mini

o1-preview

o1

GPT-4o

數(shù)學(xué)

AIME

70.0%

44.6%

74.4%

-

編碼

Codeforces Elo

1650

1258

1673

-

STEM

GPQA (科學(xué))

更高

更低

-

更低

STEM

MATH-500

更高

-

-

更低

 

MMLU

-

-

-

更高

  • o1-mini 在 AIME 數(shù)學(xué)競賽中取得了 70.0% 的成績,與 o1 (74.4%) 相當(dāng),并優(yōu)于 o1-preview (44.6%)。
  • o1-mini 在 Codeforces 編碼競賽中獲得了 1650 Elo 的評分,與 o1 (1673) 相當(dāng),并高于 o1-preview (1258)。
  • 在一些需要推理能力的學(xué)術(shù)基準(zhǔn)測試中,例如 GPQA (科學(xué)) 和 MATH-500,o1-mini 的表現(xiàn)優(yōu)于 GPT-4o。
  • 在人類偏好評估中,o1-mini 在需要推理能力的領(lǐng)域優(yōu)于 GPT-4o,但在語言類領(lǐng)域則不如 GPT-4o。

四、o1-mini 的安全性

  • o1-mini 采用與 o1-preview 相同的對齊和安全技術(shù)進(jìn)行訓(xùn)練。
  • 在內(nèi)部版本的 StrongREJECT 數(shù)據(jù)集上,o1-mini 的越獄魯棒性比 GPT-4o 高 59%。

指標(biāo)

GPT-4o

o1-mini

對有害提示的拒絕率(標(biāo)準(zhǔn))

0.99

0.99

對有害提示的安全完成率(挑戰(zhàn):越獄和邊緣案例)

0.714

0.932

對良性邊緣案例的合規(guī)性(“不過度拒絕”)

0.91

0.923

Goodness@0.1 StrongREJECT 越獄評估

0.22

0.83

人工來源的越獄評估

0.77

0.95

五、o1-mini 的局限性

  • o1-mini 在非 STEM 主題(如日期、傳記和冷知識)方面的知識儲備有限。

六、未來展望

  • OpenAI 將在未來版本中改進(jìn) o1-mini 在非 STEM 領(lǐng)域的知識儲備。
  • OpenAI 還將嘗試將 o1-mini 擴(kuò)展到其他模態(tài)和 STEM 以外的專業(yè)領(lǐng)域。

OpenAI o1-mini 是一款專注于 STEM 領(lǐng)域的經(jīng)濟(jì)高效推理模型,在數(shù)學(xué)和編碼方面表現(xiàn)出色。o1-mini 比大型語言模型更經(jīng)濟(jì)、更快,是需要推理能力但對世界知識要求不高的應(yīng)用的理想選擇。

來源:

https://openai.com/index/openai-o1-mini-advancing-cost-efficient-reasoning/

 

LibreOffice 24.8.1 發(fā)布,注重隱私保護(hù)的辦公套件

2024 年 9 月 12 日 – LibreOffice 24.8.1 發(fā)布! 這是 LibreOffice 24.8 系列的第一個次要版本 ,適用于 Windows(Intel、AMD 和 ARM)、macOS(Apple 和 Intel)和 Linux。

主要特點(diǎn)

  • 注重隱私: LibreOffice 24.8 系列專為注重隱私的辦公套件用戶而優(yōu)化,他們希望完全控制自己共享的信息。LibreOffice 確保用戶能夠決定是否以及與誰共享他們創(chuàng)建的內(nèi)容。
  • 功能豐富: LibreOffice 提供了一系列界面選項,以適應(yīng)不同的用戶習(xí)慣,從傳統(tǒng)到現(xiàn)代,并通過優(yōu)化桌 面上的可用空間,最大限度地利用不同的屏幕尺寸,只需點(diǎn)擊一兩次即可實現(xiàn)最多的功能。
  • 完全互操作性: LibreOffice 基于 LibreOffice 技術(shù)引擎,可提供更好的用戶體驗,并生成基于兩種可用 ISO 標(biāo)準(zhǔn)的相同且完全可互操作的文檔:開放文檔格式 (ODT、ODS 和 ODP) 和專有的 Microsoft OOXML (DOCX、XLSX 和 PPTX)。
  • 企業(yè)級支持: TDF 強(qiáng)烈推薦生態(tài)系統(tǒng)合作伙伴提供的 LibreOffice Enterprise 系列應(yīng)用程序,適用于桌面、移動和云,具有廣泛的專用增值功能和其他優(yōu)勢,例如 SLA。

免費(fèi)教學(xué)更多>>

iPad 9因低內(nèi)存徹底退出游戲舞臺 上汽大眾銷量穩(wěn)進(jìn)的背后,是 “德系品質(zhì)+中國智慧”的淡定 快!猛!狠!一汽奧迪在華閃電布網(wǎng):Q6L e-tron“百店齊發(fā)” 23 萬的小鵬G7,「硬剛」Model Y和小米YU7 廣汽首款量產(chǎn)飛行汽車開啟預(yù)訂 左手華為右手小米!廣汽豐田不愧是最強(qiáng)合資新勢力 原來特斯拉的前向攝像頭是用來提升自動駕駛與智能召喚性能的 5月新能源乘用車銷量124萬輛,比亞迪領(lǐng)先特斯拉跌至第五 首屆人工智能與智慧治理大學(xué)生創(chuàng)新創(chuàng)業(yè)大賽蘇州收官 大學(xué)AI通識課,應(yīng)該怎么開 20-40萬內(nèi)被市場嚴(yán)重低估的10款車,性價比超高,好開質(zhì)量過硬 售價33.99萬元,2025款智己LS7煥新版上市,787馬力,電磁懸掛 男人必須擁有一臺勞斯萊斯閃靈 高端SUV的痛點(diǎn)破局之戰(zhàn),騰勢N9對比問界M9,誰是理想答案? 廣大退役戰(zhàn)友們:華系MPV“頭把交椅”,憑啥是它? 下半年最值得期待的SUV之一!會比YU7還火嗎? 阿維塔12 (755km續(xù)航) PK 智界S7 (855km續(xù)航),28.9萬級純電車大比拼 召回20萬輛大眾速騰,啥情況? 大疆IQ.Pilot深度體驗:邁騰L2+級智駕能否吊打新勢力? 勞斯萊斯設(shè)計風(fēng)格加持,榮威M7 DMH入局插混中大型轎車,或12W起 降價了!13.77萬,2025款東風(fēng)雪鐵龍凡爾賽C5X正式上市 終于用上側(cè)滑門了,五菱銀標(biāo)全新MPV官方諜照發(fā)布 配置全面升級,續(xù)航表現(xiàn)突出,試駕長安啟源Q07 安全為盾,科技為矛,47項升級的別克新E5再當(dāng)合資電動先鋒 別克何以要自降身價! 接班軒逸成笑話?大定超2萬的日產(chǎn)N7,上市首月只賣出3034輛 比亞迪唐L明年將出口澳大利亞:更名“海獅8”挑戰(zhàn)7座SUV市場 國產(chǎn)雙雄對決:吉利VSQIRUI,誰才是國民家轎“真頂流”? 奔馳AMG C 43上市|智己LS7煥新版正式發(fā)布|豐田bZ5開啟交付 寶馬征戰(zhàn)勒芒24小時耐力賽:以科技賦能極致駕趣,重塑賽道傳奇
主站蜘蛛池模板: 一路商机网-品牌招商加盟优选平台-加盟店排行榜平台 | SDG吸附剂,SDG酸气吸附剂,干式酸性气体吸收剂生产厂家,超过20年生产使用经验。 - 富莱尔环保设备公司(原名天津市武清县环保设备厂) | 碳化硅,氮化硅,冰晶石,绢云母,氟化铝,白刚玉,棕刚玉,石墨,铝粉,铁粉,金属硅粉,金属铝粉,氧化铝粉,硅微粉,蓝晶石,红柱石,莫来石,粉煤灰,三聚磷酸钠,六偏磷酸钠,硫酸镁-皓泉新材料 | 北京开业庆典策划-年会活动策划公司-舞龙舞狮团大鼓表演-北京盛乾龙狮鼓乐礼仪庆典策划公司 | 广东西屋电气有限公司-广东西屋电气有限公司 | 武汉印刷厂-不干胶标签印刷厂-武汉不干胶印刷-武汉标签印刷厂-武汉标签制作 - 善进特种标签印刷厂 | 立式硫化罐-劳保用品硫化罐-厂家直销-山东鑫泰鑫硫化罐厂家 | 喷漆房_废气处理设备-湖北天地鑫环保设备有限公司 | 家德利门业,家居安全门,别墅大门 - 安徽家德利门业有限公司 | 税筹星_灵活用工平台_企业财务顾问_财税法薪综合服务平台 | 单电机制砂机,BHS制砂机,制沙机设备,制砂机价格-正升制砂机厂家 单级/双级旋片式真空泵厂家,2xz旋片真空泵-浙江台州求精真空泵有限公司 | 防水套管厂家-柔性防水套管-不锈钢|刚性防水套管-天翔管道 | MES系统工业智能终端_生产管理看板/安灯/ESOP/静电监控_讯鹏科技 | 睿婕轻钢别墅_钢结构别墅_厂家设计施工报价 | 除尘器布袋骨架,除尘器滤袋,除尘器骨架,电磁脉冲阀膜片,卸灰阀,螺旋输送机-泊头市天润环保机械设备有限公司 | 烟雾净化器-滤筒除尘器-防爆除尘器-除尘器厂家-东莞执信环保科技有限公司 | EPK超声波测厚仪,德国EPK测厚仪维修-上海树信仪器仪表有限公司 | 电动垃圾车,垃圾清运车-江苏速利达机车有限公司 | 佛山市钱丰金属不锈钢蜂窝板定制厂家|不锈钢装饰线条|不锈钢屏风| 电梯装饰板|不锈钢蜂窝板不锈钢工艺板材厂家佛山市钱丰金属制品有限公司 | 百度关键词优化_网站优化_SEO价格 - 云无限好排名 | RO反渗透设备_厂家_价格_河南郑州江宇环保科技有限公司 | 北京网站建设|北京网站开发|北京网站设计|高端做网站公司 | 加气混凝土砌块设备,轻质砖设备,蒸养砖设备,新型墙体设备-河南省杜甫机械制造有限公司 | 断桥铝破碎机_铝合金破碎机_废铁金属破碎机-河南鑫世昌机械制造有限公司 | 重庆波纹管|重庆钢带管|重庆塑钢管|重庆联进管道有限公司 | 网带通过式抛丸机,,网带式打砂机,吊钩式,抛丸机,中山抛丸机生产厂家,江门抛丸机,佛山吊钩式,东莞抛丸机,中山市泰达自动化设备有限公司 | 铸铁平台,大理石平台专业生产厂家_河北-北重机械 | 武汉天安盾电子设备有限公司 - 安盾安检,武汉安检门,武汉安检机,武汉金属探测器,武汉测温安检门,武汉X光行李安检机,武汉防爆罐,武汉车底安全检查,武汉液体探测仪,武汉安检防爆设备 | TTCMS自助建站_网站建设_自助建站_免费网站_免费建站_天天向上旗下品牌 | 安平县鑫川金属丝网制品有限公司,声屏障,高速声屏障,百叶孔声屏障,大弧形声屏障,凹凸穿孔声屏障,铁路声屏障,顶部弧形声屏障,玻璃钢吸音板 | 厌氧反应器,IC厌氧反应器,厌氧三相分离器-山东创博环保科技有限公司 | 电解抛光加工_不锈钢电解抛光_常州安谱金属制品有限公司 | 艺术涂料_进口艺术涂料_艺术涂料加盟_艺术涂料十大品牌 -英国蒙太奇艺术涂料 | 列管冷凝器,刮板蒸发器,外盘管反应釜厂家-无锡曼旺化工设备有限公司 | 海日牌清洗剂-打造带电清洗剂、工业清洗剂等清洗剂国内一线品牌 海外整合营销-独立站营销-社交媒体运营_广州甲壳虫跨境网络服务 | 悬浮拼装地板_篮球场木地板翻新_运动木地板价格-上海越禾运动地板厂家 | 儿童语言障碍训练-武汉优佳加感统文化发展有限公司 | 电动卫生级调节阀,电动防爆球阀,电动软密封蝶阀,气动高压球阀,气动对夹蝶阀,气动V型调节球阀-上海川沪阀门有限公司 | 智能楼宇-楼宇自控系统-楼宇智能化-楼宇自动化-三水智能化 | 皮带机_移动皮带机_大倾角皮带机_皮带机厂家 - 新乡市国盛机械设备有限公司 | 皮带机_移动皮带机_大倾角皮带机_皮带机厂家 - 新乡市国盛机械设备有限公司 |