美女张开腿黄网站免费,亚洲成a人片在线观看无码,无码少妇一区二区三区,亚洲色精品三区二区一区

  •   歡迎光臨~~~
  •   歡迎光臨~~~

融資可以買什么股票:買股票哪個軟件好-最強(qiáng)性價比?MiniMax開源推理模型M1:支持最高百萬上下文輸入

摘要:   MiniMax發(fā)布新款開源大模型,稱其性價比優(yōu)于DeepSeek。  6月17日,國內(nèi)大模型獨(dú)角獸MiniMax發(fā)布世界上第一個開源的大規(guī)模混合架構(gòu)的推理模型Mini...
代碼 名稱 當(dāng)前價 漲跌幅 最高價 最低價 成交量(萬)

  MiniMax發(fā)布新款開源大模型,稱其性價比優(yōu)于DeepSeek。

  6月17日,國內(nèi)大模型獨(dú)角獸MiniMax發(fā)布世界上第一個開源的大規(guī)?;旌霞軜?gòu)的推理模型MiniMax-M1 ,這也是“MiniMaxWeek”系列發(fā)布活動的首個對外發(fā)布。

  據(jù)MiniMax介紹,M1在面向生產(chǎn)力的復(fù)雜場景中能力是開源模型中的最好一檔,超過國內(nèi)的閉源模型 ,接近海外的最領(lǐng)先模型,同時又有業(yè)內(nèi)最高的性價比 。

  MiniMax披露,M1的優(yōu)勢是支持目前業(yè)內(nèi)最高的100萬上下文的輸入 ,和閉源模型里面的GoogleGemini2.5Pro一樣,是DeepSeekR1的8倍,以及業(yè)內(nèi)最長的8萬Token推理輸出。

  此次MiniMaxM1的最大優(yōu)勢之一體現(xiàn)在成本上。根據(jù)M1大模型分析自身的技術(shù)優(yōu)勢顯示 ,MiniMaxM1采用低成本訓(xùn)練,僅用512塊H800GPU三周時間,成本53.47萬美元(約385萬元) 。

  MiniMax稱 ,得益于以閃電注意力機(jī)制為主的混合架構(gòu) ,從而在計算長的上下文輸入以及深度推理的時候顯著高效。根據(jù)推算,在生成長度為10萬tokens的場景下,MiniMax-M1的計算量(FLOPs)為DeepSeekR1的25% ,在長文本處理任務(wù)中具備顯著優(yōu)勢。

  據(jù)M1的分析表示,MiniMaxM1的核心優(yōu)勢在于超長上下文處理能力和極低的算力消耗,同時在復(fù)雜任務(wù)(如工具調(diào)用、長文本理解)中表現(xiàn)接近甚至超越DeepSeekR1 ,提供更靈活的API定價策略,尤其適合需要處理百萬級token的場景(如法律文檔分析 、代碼庫理解) 。DeepSeekR1則在傳統(tǒng)數(shù)學(xué)推理和編程基準(zhǔn)測試中略占優(yōu)勢,但受限于上下文長度和計算效率 ,在長文本任務(wù)中明顯落后M1。

  價格方面,M1在MiniMaxAPP和Web上支持不限量免費(fèi)使用。在API方面,第一檔0-32k的輸入長度時 ,輸入0.8元/百萬token,輸出8元/百萬token;第二檔32k-128k的輸入長度時,輸入1.2元/百萬token ,輸出16元/百萬token;第三檔128k-1M輸入長度時 ,輸入2.4元/百萬token,輸出24元/百萬token 。

  值得注意的是,DeepSeek已成為大模型廠商對標(biāo)的“風(fēng)向標(biāo)”。此前字節(jié)跳動旗下火山引擎最新發(fā)布豆包大模型1.6 ,首創(chuàng)按“輸入長度 ”區(qū)間定價,深度思考、多模態(tài)能力與基礎(chǔ)語言模型統(tǒng)一價格,稱其綜合成本只有DeepSeekR1三分之一 ,每生成一條5秒的1080P視頻只需3.67元,為行業(yè)最低。

  不過,被視為集體競爭對手的DeepSeekR1也在持續(xù)升級中 。5月29日 ,據(jù)DeepSeek公告,DeepSeekR1模型已完成小版本升級,當(dāng)前版本為DeepSeek-R1-0528 。用戶通過官方網(wǎng)站、APP或小程序進(jìn)入對話界面后 ,開啟“深度思考”功能即可體驗(yàn)最新版本。API也已同步更新,調(diào)用方式不變。

  新版DeepSeekR1針對“幻覺”問題進(jìn)行了優(yōu)化 。與舊版相比,更新后的模型在改寫潤色 、總結(jié)摘要、閱讀理解等場景中 ,幻覺率降低45-50%左右 ,能夠有效地提供更為準(zhǔn)確、可靠的結(jié)果。

  從社交媒體的反饋來看,網(wǎng)友最為關(guān)注的是此次DeepSeekR1更新后的思考時間變長。據(jù)測評顯示,此次DeepSeek單任務(wù)處理時長可達(dá)30-60分鐘 。

你可能想看:
分享到:

發(fā)表評論

評論列表

還沒有評論,快來說點(diǎn)什么吧~