阿里通義千問發佈小尺寸模型Qwen3-4B新版本
8月7日,阿里通義千問發佈更小尺寸新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507。據通義千問介紹,在非推理領域,Qwen3-4B-Instruct-2507全面超越了閉源的GPT4.1-Nano;在推理領域,Qwen3-4B-Thinking-2507甚至可以媲美中等規模的Qwen3-30B-A3B(thinking)。目前新模型已在魔搭社區、HuggingFace正式開源。
相關資訊
- ▣ 阿里雲發佈通義千問2.0千億參數模型與通義千問App
- ▣ 阿里雲發佈通義千問2.5,開源通義千問1100億參數模型
- ▣ 阿里雲正式發佈通義千問2.5,開源通義千問1100億參數模型
- ▣ 阿里雲發佈通義千問2.5
- ▣ 阿里雲通義千問旗艦版模型Qwen2.5-Max發佈
- ▣ 阿里雲發佈通義千問旗艦版模型Qwen2.5-Max
- ▣ 阿里通義千問Qwen2大模型發佈並同步開源
- ▣ 阿里發佈並開源推理模型通義千問QwQ-32B
- ▣ 阿里雲通義千問發佈業界首個開源多模態推理模型
- ▣ 阿里通義千問宣佈更新旗艦版Qwen3模型
- ▣ 阿里巴巴續漲2.9% 發佈新版通義千問Qwen 2.5-Max AI模型
- ▣ SAP宣佈接入阿里通義千問
- ▣ 阿里通義千問推出多模態模型Qwen VLo
- ▣ 阿里通義千問開源首個MoE模型
- ▣ 阿里發佈通義千問旗艦版模型 聲稱超越DeepSeek 阿里巴巴美股一度漲超7%
- 阿里雲發佈通義千問2.5 全面趕超GPT-4 Turbo
- ▣ 阿里通義千問更新旗艦版Qwen3模型
- ▣ 阿里巴巴(09988)正式發佈全新的通義千問AI編程大模型Qwen3-Coder
- ▣ 阿里雲通義千問推出開源Qwen2.5-1M模型
- ▣ 阿里通義千問推出編程模型Qwen3-Coder-Flash
- ▣ 阿里巴巴-W高開逾5% 此前發佈新版通義千問Qwen 2.5-Max AI模型
- ▣ 國產大模型又有重磅!阿里發佈通義千問旗艦版模型,採用開源策略
- ▣ 阿里雲發佈通義千問2.5,性能全面趕超GPT-4 Turbo
- ▣ 阿里雲通義千問開源
- ▣ 賽道Hyper | 阿里開源通義千問3向量模型
- ▣ 阿里巴巴開源新一代通義千問模型Qwen3
- ▣ 阿里開源通義千問AI編程大模型Qwen3-Coder
- ▣ 阿里通義千問推出新模型Qwen3-30B-A3B-Thinking-2507
- ▣ 阿里通義千問Qwen3-30B-A3B模型推出新版本
- ▣ 阿里雲通義開源過程獎勵PRM模型,7B尺寸比GPT-4o更能發現推理錯誤