最强开源编程大模型一夜易主:精通80+语言仅22B
时间:2024-06-01 13:45来源:未知 作者:未知 点击:

  在80多种编程语言上进行过训练后,Codestral用更少的参数实现了更高的性能,窗口长度也达到了32k,相比之前一众4k、8k的模型大幅增加。

  而且已经有人表示,GPT-4o和Claude3-Opus都失败的代码编辑任务,被Codestral成功解决了。

  另一方面,还有网友直接@了知名本地大模型框架Ollama,希望能够支持Codestral,结果Ollama这边也迅速响应,在请求发出后1个小时就增加了对Codestral的支持。

  值得一提的是,其中的COBOL诞生于1959年,但至今全球仍有43%的银行系统依赖它,然而另一方面,现在会用的人数却寥寥无几,而且普遍年事已高。

  说回到Codestral,虽然参数量只有不到三分之一,但测评成绩已经大幅超过了70B的Code Llama。

  结果,Codestral在其中的三项测试中都取得了最佳成绩,并对Llama 3和Code Llama形成了全面超越。

  数据库方面,在针对SQL的Spider测试中,Codestral的表现也与通用模型Llama3十分接近。

  对于其他一些编程语言,Codestral和通用版Llama3各有胜负,平均成绩则小幅超过了Llama3,但相对于Code Llama的优势是十分明显的。

  速度方面,使用在线对话版本,只要三秒钟就能构建出一个带有顶部banner和侧边栏的HTML框架。

  如果还是不会部署的话,也可以到Mistral的在线对话平台Le Chat当中,直接使用网页进行对话。

  本次发布的CodeStral使用的许可协议也正是MNPL,按照规定仅可用于研究目的,不能进行商用。

  有开源作者就此吐槽,他们用我代码的时候从未征求我的意见,为什么还反过来要求我遵守他们的规定,这实在是太荒谬了。

  官方同时也表示,虽然Codestral不能商用,但并不意味着之后的其他开源模型也是如此,同时明确表示后续会继续发布基于Apache 2.0协议的其他模型。

  本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。

(责任编辑:)

关键词:

随机推荐

联系我们 -