午夜精品久久久久久影视riav-午夜精品久久久久久久久-午夜精品久久久久久久第一页-午夜精品久久久久久久99热浪潮-国产亚洲精品久久综合影院-国产亚洲精品久久午夜

歡迎來(lái)到 減肥詞典網(wǎng) , 一個(gè)專(zhuān)業(yè)的減肥知識(shí)學(xué)習(xí)網(wǎng)站!

加入收藏

您所在的位置:首頁(yè) > 資訊 > 最新資訊

最新資訊

王小川的百川智能發(fā)布開(kāi)源中英文大模型,清華北大率先使用

分類(lèi): 最新資訊 減肥詞典 編輯 : 大寶 發(fā)布 : 06-18

閱讀 :213

6月15日消息,王小川新創(chuàng)業(yè)公司百川智能,推出70億參數(shù)量的中英文預(yù)訓(xùn)練大模型——baichuan-7B。目前這款大模型已在Hugging Face、Github以及Model Scope平臺(tái)發(fā)布。公司CEO王小川表示:“本次開(kāi)源模型的發(fā)布是百川智能成立2個(gè)月后的第一個(gè)里程碑,對(duì)百川智能而言是一個(gè)良好的開(kāi)局。baichuan-7B模型,不僅能為中國(guó)的AGI事業(yè)添磚加瓦,也為世界大模型開(kāi)源社區(qū)貢獻(xiàn)了新的力量。”據(jù)了解,baichuan-7B在C-Eval、AGIEval和Gaokao三個(gè)中文評(píng)估基準(zhǔn)進(jìn)行了綜合評(píng)估。在中文C-EVAL的評(píng)測(cè)中,baichuan-7B的綜合評(píng)分達(dá)到了42.8分,超過(guò)了ChatGLM-6B的38.9分。C-Eval評(píng)測(cè)基準(zhǔn)由上海交通大學(xué)、清華大學(xué)以及愛(ài)丁堡大學(xué)聯(lián)合創(chuàng)建,是面向中文語(yǔ)言模型的綜合考試評(píng)測(cè)集,覆蓋了52個(gè)來(lái)自不同行業(yè)領(lǐng)域的學(xué)科。在AGIEval的評(píng)測(cè)里,baichuan-7B綜合評(píng)分達(dá)到34.4分,超過(guò)LLaMa-7B、Falcon-7B、Bloom-7B以及ChatGLM-6B等其他開(kāi)源模型。AGIEval評(píng)測(cè)基準(zhǔn)由微軟研究院發(fā)起,旨在全面評(píng)估基礎(chǔ)模型在人類(lèi)認(rèn)知和問(wèn)題解決相關(guān)任務(wù)上的能力,包含了中國(guó)的高考、司法考試,以及美國(guó)的SAT、LSAT、GRE和GMAT等20個(gè)公開(kāi)且嚴(yán)謹(jǐn)?shù)墓俜饺雽W(xué)和職業(yè)資格考試。在GAOKAO評(píng)測(cè)中,baichuan-7B的綜合評(píng)分達(dá)到了36.2分,領(lǐng)先于同參數(shù)規(guī)模的各種其他預(yù)訓(xùn)練模型。GAOKAO評(píng)測(cè)基準(zhǔn)是復(fù)旦大學(xué)研究團(tuán)隊(duì)創(chuàng)建的評(píng)測(cè)框架,以中國(guó)高考題目作為數(shù)據(jù)集,用于測(cè)試大模型在中文語(yǔ)言理解和邏輯推理能力方面的表現(xiàn)。此外baichuan-7B在英文上表現(xiàn)同樣亮眼。在MMLU的評(píng)測(cè)中baichuan-7B綜合評(píng)分高達(dá)42.5分,領(lǐng)先英文開(kāi)源預(yù)訓(xùn)練模型LLaMA-7B的34.2分以及中文開(kāi)源模型ChatGLM-6B的36.9分。MMLU由加州大學(xué)伯克利分校等知名高校共同打造,集合了科學(xué)、工程、數(shù)學(xué)、人文、社會(huì)科學(xué)等領(lǐng)域的57個(gè)科目,主要目標(biāo)是對(duì)模型的英文跨學(xué)科專(zhuān)業(yè)能力進(jìn)行深入測(cè)試。其內(nèi)容廣泛,從初級(jí)水平一直涵蓋到高級(jí)專(zhuān)業(yè)水平。百川智能介紹稱(chēng),訓(xùn)練語(yǔ)料對(duì)大模型的訓(xùn)練結(jié)果至關(guān)重要。在構(gòu)建預(yù)訓(xùn)練語(yǔ)料庫(kù)方面,公司以高質(zhì)量中文語(yǔ)料為基礎(chǔ),同時(shí)融合了優(yōu)質(zhì)的英文數(shù)據(jù)。在數(shù)據(jù)質(zhì)量方面,通過(guò)質(zhì)量模型對(duì)數(shù)據(jù)進(jìn)行打分,對(duì)原始數(shù)據(jù)集進(jìn)行篇章級(jí)和句子級(jí)的精確篩選;在內(nèi)容多樣性方面,利用自研超大規(guī)模局部敏感哈希聚類(lèi)系統(tǒng)和語(yǔ)義聚類(lèi)系統(tǒng),對(duì)數(shù)據(jù)進(jìn)行了多層次多粒度的聚類(lèi),最終構(gòu)建了包含1.2萬(wàn)億token的兼顧質(zhì)量和多樣性的預(yù)訓(xùn)練數(shù)據(jù)。相較于其他同參數(shù)規(guī)模的開(kāi)源中文預(yù)訓(xùn)練模型,數(shù)據(jù)量提高了超過(guò)50%。在萬(wàn)億優(yōu)質(zhì)中英文數(shù)據(jù)的基礎(chǔ)上,為了更好地提升訓(xùn)練效率,baichuan-7B深度整合了模型算子來(lái)加快計(jì)算流程,并針對(duì)任務(wù)負(fù)載和集群配置,自適應(yīng)優(yōu)化了模型并行策略以及重計(jì)算策略。通過(guò)高效的訓(xùn)練過(guò)程調(diào)度通信,baichuan-7B成功地實(shí)現(xiàn)了計(jì)算與通信的高效重疊,進(jìn)而達(dá)到了超線性的訓(xùn)練加速,在千卡集群上訓(xùn)練吞吐達(dá)到180+Tflops的水平。同時(shí),已有的開(kāi)源模型窗口長(zhǎng)度在2K以內(nèi),對(duì)于一些長(zhǎng)文本建模任務(wù),如需要引入外部知識(shí)做搜索增強(qiáng)的場(chǎng)景,更長(zhǎng)的處理長(zhǎng)度有助于模型在訓(xùn)練與推理階段捕獲越多的上下文信息,2K的處理長(zhǎng)度存在比較大的制約。baichuan-7B基于高效的attention算子優(yōu)化實(shí)現(xiàn)了萬(wàn)級(jí)別超長(zhǎng)動(dòng)態(tài)窗口的擴(kuò)張能力,本次開(kāi)源的預(yù)訓(xùn)練模型開(kāi)放了4K上下文窗口,使模型應(yīng)用場(chǎng)景更加廣泛。此外,baichuan-7B還對(duì)模型訓(xùn)練流程進(jìn)行了深度優(yōu)化,采用了更科學(xué)且穩(wěn)定的訓(xùn)練流程和超參數(shù)選擇,使得baichuan-7B模型的收斂速度大大提升。與同等參數(shù)規(guī)模的模型相比,baichuan-7B在困惑度(PPL)和訓(xùn)練損失(training loss)等關(guān)鍵性能指標(biāo)上表現(xiàn)更加優(yōu)秀。百川智能稱(chēng),baichuan-7B代碼采用Apache-2.0協(xié)議,模型權(quán)重采用了免費(fèi)商用協(xié)議,只需進(jìn)行簡(jiǎn)單登記即可免費(fèi)商用。baichuan-7B此次開(kāi)源的內(nèi)容包含了推理代碼、INT4量化實(shí)現(xiàn)、微調(diào)代碼,以及預(yù)訓(xùn)練模型的權(quán)重。其中,微調(diào)代碼方便用戶對(duì)模型進(jìn)行調(diào)整和優(yōu)化;推理代碼與INT4量化實(shí)現(xiàn)則有助于開(kāi)發(fā)者低成本地進(jìn)行模型的部署和應(yīng)用;預(yù)訓(xùn)練模型權(quán)重開(kāi)源后,用戶則可以直接使用預(yù)訓(xùn)練模型進(jìn)行各種實(shí)驗(yàn)研究。據(jù)了解,北京大學(xué)和清華大學(xué)兩所頂尖大學(xué)已率先使用baichuan-7B模型推進(jìn)相關(guān)研究工作,并計(jì)劃在未來(lái)與百川智能深入合作,共同推動(dòng)baichuan-7B模型的應(yīng)用和發(fā)展。(易科)

下一篇:主板IPO年內(nèi)第二單“暫緩表決”!兩大問(wèn)題絆住巍華新材 下一篇 【方向鍵 ( → )下一篇】

上一篇:TA們選15英寸MacBookAir的三個(gè)理由:輕薄、大屏、M2芯片 上一篇 【方向鍵 ( ← )上一篇】

主站蜘蛛池模板: 三级貂蝉艳史 在线观看 | 黄色一级毛片免费 | 偷偷要色偷偷 | 国内精品伊人久久久影院 | 亚洲一二三产品区别在哪里 | 国产精品av | 国产精品久久久久久久久LI无码 | 一个人高清在线观看日本免费 | 东京热百度影音 | 九九精品视频在线播放 | 日本 一二三 不卡 免费 | 亚洲精品午睡沙发系列 | 色一欲一性一乱一区二区三区 | 美女张开腿让我了一夜 | 116美女写真午夜电影z | 国产第一页浮力影院 | 男生互捏jiji的故事 | 性做久久久久久久久浪潮 | 小莹的性荡生活 | 我要色色网 | 色多多污污在线播放免费 | 处破女免费播放 | 99re久久免费热在线视频手机 | 亚洲国产成人综合 | 日韩hd高清xxxⅹ | 翘臀少妇被扒开屁股日出水爆乳 | 欧美18精品久久久无码午夜福利 | 亚洲AV久久久噜噜噜久久 | 亚洲AV中文字幕无码久久 | 男的插曲女的下面免费APP | oldgrand欧洲老妇人 | 办公室里呻吟的丰满老师电影 | 中国国产不卡视频在线观看 | 熟妇无码乱子成人精品 | 久久精品国产免费 | 久久99热狠狠色一区二区 | 在线观看中文字幕码2021不用下载 | china男士同性视频tv | 日本久久精品免视看国产成人 | 99精品在线播放 | 永久免费精品精品永久-夜色 |