最强开源编程大模型一夜易主：精通80+语言仅22B-中国建造师信息网

最强开源编程大模型一夜易主：精通80+语言仅22B

时间:2024-06-01 13:45来源:未知作者:未知点击:

　　在80多种编程语言上进行过训练后，Codestral用更少的参数实现了更高的性能，窗口长度也达到了32k，相比之前一众4k、8k的模型大幅增加。

　　而且已经有人表示，GPT-4o和Claude3-Opus都失败的代码编辑任务，被Codestral成功解决了。

　　另一方面，还有网友直接@了知名本地大模型框架Ollama，希望能够支持Codestral，结果Ollama这边也迅速响应，在请求发出后1个小时就增加了对Codestral的支持。

　　值得一提的是，其中的COBOL诞生于1959年，但至今全球仍有43%的银行系统依赖它，然而另一方面，现在会用的人数却寥寥无几，而且普遍年事已高。

　　说回到Codestral，虽然参数量只有不到三分之一，但测评成绩已经大幅超过了70B的Code Llama。

　　结果，Codestral在其中的三项测试中都取得了最佳成绩，并对Llama 3和Code Llama形成了全面超越。

　　数据库方面，在针对SQL的Spider测试中，Codestral的表现也与通用模型Llama3十分接近。

　　对于其他一些编程语言，Codestral和通用版Llama3各有胜负，平均成绩则小幅超过了Llama3，但相对于Code Llama的优势是十分明显的。

　　速度方面，使用在线对话版本，只要三秒钟就能构建出一个带有顶部banner和侧边栏的HTML框架。

　　如果还是不会部署的话，也可以到Mistral的在线对话平台Le Chat当中，直接使用网页进行对话。

　　本次发布的CodeStral使用的许可协议也正是MNPL，按照规定仅可用于研究目的，不能进行商用。

　　有开源作者就此吐槽，他们用我代码的时候从未征求我的意见，为什么还反过来要求我遵守他们的规定，这实在是太荒谬了。

　　官方同时也表示，虽然Codestral不能商用，但并不意味着之后的其他开源模型也是如此，同时明确表示后续会继续发布基于Apache 2.0协议的其他模型。

　　本文为澎湃号作者或机构在澎湃新闻上传并发布，仅代表该作者或机构观点，不代表澎湃新闻的观点或立场，澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。

(责任编辑：)

关键词:

随机推荐