
Zhidongxi May -set | Chen Junda编辑| Yunpeng Zhidongxi于7月23日报道,阿里巴巴的QWEN团队开设了最新的QWEN3-CODER-480B-A35B结构编程模型的来源。 Qwen的团队表示,这是该团队编程编程最新的最强模型,具有480B参数,35B的激活参数,对256K上下文的民间支持,可以扩展到100万个上下文(输入),最大输出为65,000个代币。在基准测试中,QWEN3-CODER在编程和代理活动中表现出色。它已经在三种类型的活动中获取了SOTA的开源:编码代理(代理编程),浏览器代理(浏览器使用代理)和工具使用代理(代理工具),它超过了Kimi K2和DeepSeek V3的开源源以及诸如GPT -4.1的封闭资源模型,例如Claude Sonnet 4,Models a Models a,Modelmings complosing complosing complosing cla of。 Qwen3-Coder有各种尺寸。目前,强者EST变体是其开源,其参数超过了阿里巴巴旗舰型Qwen3的235b(2350亿),而Kimi K2的参数则不超过1T(1万亿)。根据阿里巴巴的官方介绍,在刚进入该行业的程序员的Qwen3-Coder的帮助下,有一天可以完成一名高级程序员的工作,只需5分钟即可以最快的速度生成官方网站。扩展全文
除模型外,Qwen还打开了QWEN代码行工具叉的Gemini Code -QWEN代码。该工具适用于自定义信号和功能协议,该协议更充分地揭示了QWEN3-CODER在代理编程活动中的功能。
该模型是在大型阿里巴巴云服务平台Baiil上推出的。它的API采用了一系列费用来根据输入令牌的成本调整价格。价格为256K 〜1m,价格为6/百万美元的标记,产出价格为60/百万个令牌。相比之下,Claude Sonnet 4的投入和产出价格分别为3/百万个令牌和15/百万美元的令牌,类似于Qwen3-Coder 128K〜256K。
QWEN3-编码也可以在QWEN Web Web中启动,用户可以免费体验它。此外,它的480B版本是在“拥抱面和摩德”等开放式社区来源上发布的,可供下载和本地扩展。 Qwen在博客文章中还分享了该模型的技术细节。
模型开源地址:https://huggingface.co/qwen
Open Qwen codepinuminung ng来源:https://github.com/qwenlm/qwen-code
博客地址:https://qwenlm.github.io/blog/qwen3-coder/
1。Qwen聊天在深夜推出,国外网民很疯狂
在QWEN团队正式宣布发布QWEN3-CODER之前,该模型是在官方QWEN聊天网站上默默地推出的,而在国外的Netizens则以快节奏的技巧贡献了许多实际的测试案例。
这种情况允许Qwen3-Coder创建一个单词游戏,其规则是在六个尝试中预测六个字母的5个字母的规则。最后,QWEN3-编码提供的游戏页面和源代码如下。
提出此案的网民说,Qwen3-Coder具有符合命令,UI设计和动画的惊人功能。大多数经常的结果是在旅途中完成的,并且不需要推理。但是,在Wordle游戏设计的任务中,Qwen没有使用解析器或引用源,而是决定列举所有5个字母单词。
在寻找不同游戏的开发情况下,我们可以看到,与昨天发布的QWEN3-235B-A22B-2507相比,就美学和完成而言,QWEN3-CODER明显好于约会。
吉文Xi试图让qwen3-Coder开发一个中文和英语图书馆,并支持添加,删除,更改和审查的基本功能。可以直观地感觉到,由于推理是禁用的,Qwen3-Coder是DeveloPED非常快,初始结果在20秒内完成。当产生的结果进一步变化时,速度也会更加迅速。
从UI的角度来看,最终结果非常好,并且操作正常工作,但是它不遵循直接词中使用PHP+MySQL开发的说明。最终的交付结果完全足够作为原型的函数演示和显示,但是在实际扩展情况下的可伸缩性仍然需要完成。
Zhitiao还要求QWEN3-CODER向自己展示一个3D HTML开发的主题,该主题是创建一个3D旋转的立方体显示屏,六个表面显示不同的颜色,自动旋转,增强的照明效果和阴影等。
除编程功能外,Qwen3-Coder还提供许多其他游戏玩法,包括图像生成,视频生成等,在支持上传文档,照片,视频,奥迪O和其他内容,可以通过工具调用来实现。
正式发布后,Qwen正式发布了几起Qwen3-Coder案件。
例如,可以做到以控制爆炸的形式创建基于物理的烟囱模拟。
创建太阳系的交互式模拟,行星之间的关系通常是准确的。
开发的网络游戏的完成率很高。
2。仍有一个进行预训练的空间,并将在20,000个独立环境中进行增强研究。
QWEN团队在技术博客上分享了一些QWEN3-CODER培训详细信息。该团队认为,仍然有进一步扩展预训练的空间。
在训练前阶段,QWEN3-CODER使用了7.5万亿代币数据,该代码的成本为70%。因此,该模型在编程方面表现良好,同时还保持一般和数学功能。
在上下文方面,qwen3-coder本地支持256k上下文,并且可以通过纱线将其扩展到1m,针对仓库大小和动态数据(例如拉出请求)进行了优化,从而适合代理程序方案。
以前的QWEN3代码模型QWEN2.5代码被用于扩展合成数据。具体而言,QWEN2.5正在清洁和重新写入噪声数据,以提高整体数据质量。
在训练后阶段,QWEN团队认为,与一般对竞争级别代码的关注不同,所有代码任务自然适用于具有驱动力的大规模强化研究。该团队在更广泛的现实编程任务中扩大了《法规研究》研究的规模。
通过自动为不同的编程活动扩展测试用例,QWEN团队创造了高质量的培训机会,进一步释放了增强研究的潜力。它不仅提高了代码实施的成功率,而且还为其他任务带来了好处。
这也有所帮助红色团队进一步探索难以解决,但很容易验证的活动,这预计将是增强的肥沃土地。
在现实世界软件工程活动(例如SWE-Bench)中,Qwen3-Coder应该具有许多环境接触周期,涉及计划,使用工具,接收反馈和做出决策。在QWEN3-CODER的训练后阶段,QWEN团队引入了长期强化研究(代理加强),鼓励该模型通过与工具的多次接触周期来解决现实世界中的活动。
研究代理增强的主要挑战是扩大环境。为了解决这个问题,团队建立了一个测量的系统,能够运行20,000个独立环境。基础设施为大规模研究提供了必要的反馈,并支持大型评估。
因此,Qwen3-Coder在具有B经过证明无需理解(扩展测试)。
在此期间,QWEN代码的开放资源是用于研究目的的工具命令行接口(CLI)。它是根据双子座CLI和增强的解析器和Qwen-Coder模型的工具支持开发的。
除QWEN代码外,您还可以使用Claude Code和Qwen3 -编码与编程。仅在Dashscope平台上申请API密钥,然后安装Claude代码以启动编程。
结论:多种尺寸正在接近,探索
尽管光标切断了适合编程的模型的供应,例如Claude,但Qwen3-Coder的开放资源为国内开发人员提供了最新的替代选项。
QWEN团队宣布,他们仍在努力提高编码代理的性能,旨在允许意大利人是人类的生产力。
QWEN3-CODER的更多模型尺寸将在扩展和性能成本之间保持平衡。此外,团队探索编码代理是否可以实现自我改善。回到Sohu看看更多