123悬赏网_发布悬赏任务_广告任务平台

首頁 > 生活分享 > 免費教學 > 復雜推理大模型OpenAI o1亮相,數學與代碼能力飛躍

復雜推理大模型OpenAI o1亮相,數學與代碼能力飛躍

發布時間:2024-09-16 16:25:38

平安證券近日發布AI動態跟蹤系列(三):復雜推理大模型OpenAI o1亮相,數學與代碼能力飛躍。

以下為研究報告摘要:

9月13日,OpenAI正式發布并上線o1系列模型o1-preview和o1-mini。

平安觀點:

OpenAI計數器重置回1,o1系列開啟復雜推理序幕。本次OpenAI發布的是o1-preview(預覽版)和o1-mini(擅長STEM、更快、更便宜)兩個版本,ChatGPT付費用戶和API用戶可以使用。根據OpenAI官網介紹,o1系列被定位為用于解決難題的推理模型。對于復雜的推理任務來說,OpenAI認為o1是一個重大進步,代表了AI能力的新水平,鑒于此,OpenAI將計數器重置回1并將此系列模型命名為OpenAI o1。OpenAI研究發現,隨著強化學習(訓練時計算)和思考時間(測試時計算)的增加,o1的性能會不斷提高。因此在體驗上,與此前模型不同點在于,OpenAIo1在作出反應之前,需要像人類一樣,花更多時間思考問題。

o1基準表現明顯優于GPT-4o,數學與編碼能力實現飛躍。OpenAI實驗結果表明,在絕大多數推理任務中,o1的表現明顯優于GPT-4o。尤其是在具有挑戰性的推理基準上,o1實現了能力飛躍,1)數學能力:在美國數學奧林匹克(AIME2024)預選賽題目中,GPT-4o平均只能解決12%的問題,o1正式版達到平均74%的準確率,在使用學習評分函數重新排名1000個樣本后準確率達到93%,相當于美國排名前500的學生水平。2)編碼能力:在競爭性編程問題(Codeforces)比賽中,o1-preview、o1分別超越了62%、89%的人類競爭者,而對比GPT-4o僅超過11%。3)特定專業領域能力:GPQA diamond測試(專門用于評估模型在化學、物理和生物學等領域的專業知識水平)中,o1不僅成功完成了測試,更是超越了人類專家的表現,成為首個在GPQA diamond基準上擊敗人類專家的AI模型。

o1引入思維鏈優化邏輯推理,助力模型性能與安全提升。o1優越能力的背后,核心突破在于運用思維鏈(chain of thought)方法來處理復雜任務,OpenAI介紹到,類似于人類在回答困難問題之前可能會思考很長時間,o1在嘗試解決問題時會使用思維鏈。通過強化學習,o1學會打磨其思維鏈并改進它所使用的策略。o1學會了識別和糾正錯誤,學會了將棘手的步驟分解為更簡單的步驟,學會了在當前方法不起作用時嘗試不同的方法,此過程顯著提高了模型的推理能力。在OpenAI的一個官方演示中展示了o1-preview解答復雜問題的邏輯推理過程,o1-preview在過程中逐步顯示思考、翻譯問題、定義變量、理解問題、構建方程、解方程等與人類推理相似的步驟,最終輸出結論。同時,OpenAI認為思維鏈推理也為大模型安全性的提升提供了新思路,o1-preview在關鍵越獄評估和用于評估模型安全拒絕邊界的最嚴格內部基準上取得了顯著的改進。

投資建議:OpenAI推出專攻難題的o1系列大模型,應對復雜推理任務,o1引入思維鏈(Chain of Thought)提升邏輯推理能力,絕大多數基準表現不僅明顯超越GPT-4o,而且在數學與編碼能力上實現了重要飛躍,在理化生等專業領域的知識水平也達到新高度。OpenAI的動向始終引領全球大模型的發展,我們認為o1的正式亮相有望開啟復雜推理大模型的序幕,一方面對算力提出了更大需求,同時也將賦能下游AI應用(如編程、教育)的快速迭代。我們堅定看好AI主題的投資機會:1)算力方面,推薦工業富聯、浪潮信息、中科曙光、紫光股份、神州數碼、海光信息、龍芯中科,建議關注寒武紀、景嘉微、軟通動力;2)算法方面,推薦科大訊飛;3)應用場景方面,強烈推薦中科創達、恒生電子、盛視科技,推薦金山辦公,建議關注萬興科技、福昕軟件、同花順、彩訊股份;4)網絡安全方面,強烈推薦啟明星辰。

免費教學更多>>

iPad 9因低內存徹底退出游戲舞臺 上汽大眾銷量穩進的背后,是 “德系品質+中國智慧”的淡定 快!猛!狠!一汽奧迪在華閃電布網:Q6L e-tron“百店齊發” 23 萬的小鵬G7,「硬剛」Model Y和小米YU7 廣汽首款量產飛行汽車開啟預訂 左手華為右手小米!廣汽豐田不愧是最強合資新勢力 原來特斯拉的前向攝像頭是用來提升自動駕駛與智能召喚性能的 5月新能源乘用車銷量124萬輛,比亞迪領先特斯拉跌至第五 首屆人工智能與智慧治理大學生創新創業大賽蘇州收官 大學AI通識課,應該怎么開 20-40萬內被市場嚴重低估的10款車,性價比超高,好開質量過硬 售價33.99萬元,2025款智己LS7煥新版上市,787馬力,電磁懸掛 男人必須擁有一臺勞斯萊斯閃靈 高端SUV的痛點破局之戰,騰勢N9對比問界M9,誰是理想答案? 廣大退役戰友們:華系MPV“頭把交椅”,憑啥是它? 下半年最值得期待的SUV之一!會比YU7還火嗎? 阿維塔12 (755km續航) PK 智界S7 (855km續航),28.9萬級純電車大比拼 召回20萬輛大眾速騰,啥情況? 大疆IQ.Pilot深度體驗:邁騰L2+級智駕能否吊打新勢力? 勞斯萊斯設計風格加持,榮威M7 DMH入局插混中大型轎車,或12W起 降價了!13.77萬,2025款東風雪鐵龍凡爾賽C5X正式上市 終于用上側滑門了,五菱銀標全新MPV官方諜照發布 配置全面升級,續航表現突出,試駕長安啟源Q07 安全為盾,科技為矛,47項升級的別克新E5再當合資電動先鋒 別克何以要自降身價! 接班軒逸成笑話?大定超2萬的日產N7,上市首月只賣出3034輛 比亞迪唐L明年將出口澳大利亞:更名“海獅8”挑戰7座SUV市場 國產雙雄對決:吉利VSQIRUI,誰才是國民家轎“真頂流”? 奔馳AMG C 43上市|智己LS7煥新版正式發布|豐田bZ5開啟交付 寶馬征戰勒芒24小時耐力賽:以科技賦能極致駕趣,重塑賽道傳奇
主站蜘蛛池模板: 路斯特伺服驱动器维修,伦茨伺服驱动器维修|万骏自动化百科 | 1000帧高速摄像机|工业高速相机厂家|科天健光电技术 | 宁波普瑞思邻苯二甲酸盐检测仪,ROHS2.0检测设备,ROHS2.0测试仪厂家 | 涂层测厚仪_光泽度仪_uv能量计_紫外辐照计_太阳膜测试仪_透光率仪-林上科技 | 北京模型公司-工业模型-地产模型-施工模型-北京渝峰时代沙盘模型制作公司 | 「银杏树」银杏树行情价格_银杏树种植_山东程锦园林 | 合肥网络推广_合肥SEO网站优化-安徽沃龙First | 创客匠人-让IP变现不走弯路| 隔爆型防爆端子分线箱_防爆空气开关箱|依客思 | TTCMS自助建站_网站建设_自助建站_免费网站_免费建站_天天向上旗下品牌 | 底部填充胶_电子封装胶_芯片封装胶_芯片底部填充胶厂家-东莞汉思新材料 | 专业生产动态配料系统_饲料配料系统_化肥配料系统等配料系统-郑州鑫晟重工机械有限公司 | 广州工业氧气-工业氩气-工业氮气-二氧化碳-广州市番禺区得力气体经营部 | 特种电缆厂家-硅橡胶耐高温电缆-耐低温补偿导线-安徽万邦特种电缆有限公司 | 偏心半球阀-电动偏心半球阀-调流调压阀-旋球阀-上欧阀门有限公司 | 微型实验室真空泵-无油干式真空泵-微型涡旋耐腐蚀压缩机-思科涡旋科技(杭州)有限公司 | 导电银胶_LED封装导电银胶_半导体封装导电胶厂家-上海腾烁 | 电脑刺绣_绣花厂家_绣花章仔_织唛厂家-[源欣刺绣]潮牌刺绣打版定制绣花加工厂家 | 成都茶楼装修公司 - 会所设计/KTV装修 - 成都朗煜装饰公司 | BHK汞灯-百科|上海熙浩实业有限公司 | 成都热收缩包装机_袖口式膜包机_高速塑封机价格_全自动封切机器_大型套膜机厂家 | 小型单室真空包装机,食品单室真空包装机-百科 | 合肥钣金加工-安徽激光切割加工-机箱机柜加工厂家-合肥通快 | 油冷式_微型_TDY电动滚筒_外装_外置式电动滚筒厂家-淄博秉泓机械有限公司 | 湖南印刷厂|长沙印刷公司|画册印刷|挂历印刷|台历印刷|杂志印刷-乐成印刷 | 江门流水线|江门工作台|江门市伟涛行工业设备有限公司 | 广州番禺搬家公司_天河黄埔搬家公司_企业工厂搬迁_日式搬家_广州搬家公司_厚道搬迁搬家公司 | 红酒招商加盟-葡萄酒加盟-进口红酒代理-青岛枞木酒业有限公司 | 金属雕花板_厂家直销_价格低-山东慧诚建筑材料有限公司 | 带式压滤机_污泥压滤机_污泥脱水机_带式过滤机_带式压滤机厂家-河南恒磊环保设备有限公司 | 企业VI设计_LOGO设计公司_品牌商标设计_【北京美研】 | 水平垂直燃烧试验仪-灼热丝试验仪-漏电起痕试验仪-针焰试验仪-塑料材料燃烧检测设备-IP防水试验机 | 紫外荧光硫分析仪-硫含量分析仪-红外光度测定仪-泰州美旭仪器 | 钢木实验台-全钢实验台-化验室通风柜-实验室装修厂家-杭州博扬实验设备 | 消电检公司,消电检价格,北京消电检报告-北京设施检测公司-亿杰(北京)消防工程有限公司 | 棕刚玉-白刚玉厂家价格_巩义市东翔净水材料厂 | 碳纤维布-植筋胶-灌缝胶-固特嘉加固材料公司 | 汽车整车综合环境舱_军标砂尘_盐雾试验室试验箱-无锡苏南试验设备有限公司 | 天一线缆邯郸有限公司_煤矿用电缆厂家_矿用光缆厂家_矿用控制电缆_矿用通信电缆-天一线缆邯郸有限公司 | 快干水泥|桥梁伸缩缝止水胶|伸缩缝装置生产厂家-广东广航交通科技有限公司 | 北京模型公司-军事模型-工业模型制作-北京百艺模型沙盘公司 |