前言
ChatGPT把AI带火了,我就在想,能用它做点什么呢,总不能只让它给我们带来焦虑,也要让我们从科技浪潮中分得一点红利吧。一番查找下来,有个功能对我们程序员来说比较实用,就是AI的代码提示补全功能。最先找到的是GitHub Copilot。不幸的是GitHub Copilot 从2022年8月22日之后,开始收费。正式版定价10美元/月(人民币约67元),年付有优惠100美元/年(人民币约669元),每月 67 元还是有些小贵。经验告诉我,如果市场上存在一块大蛋糕,不可能只被一家公司看到,肯定有许多公司都在研究开发,有替代品。沿着这个思路,我找到了今天的主角CodeGeeX。
CodeGeex简介
CodeGeeX是一个具有130亿参数的多编程语言代码生成预训练模型。CodeGeeX采用华为MindSpore框架实现,在鹏城实验室“鹏城云脑II”中的192个节点(共1536个国产昇腾910 AI处理器)上训练而成。截至2022年6月22日,CodeGeeX历时两个月在20多种编程语言的代码语料库(>8500亿Token )上预训练得到。CodeGeeX有以下特点:
- 高精度代码生成:支持生成Python、C++、Java、JavaScript和Go等多种主流编程语言的代码,在多语言代码生成基准HumanEval-X代码生成任务上取得47%~60%求解率,较其他开源基线模型有更佳的平均性能。
- 跨语言代码翻译:支持代码片段在不同编程语言间进行自动翻译转换,翻译结果正确率高,在HumanEval-X代码翻译任务上超越了其它基线模型。
- 自动编程插件:CodeGeeX插件现已上架VSCode插件市场(完全免费),用户可以通过其强大的少样本生成能力,自定义代码生成风格和能力,更好辅助代码编写。
- 模型跨平台开源: 所有代码和模型权重开源开放,用作研究用途。CodeGeeX同时支持昇腾和英伟达平台,可在单张昇腾910或英伟达V100/A100上实现推理。
我使用下来,觉得CodeGeeX的主要功能是通过解读你的代码注释生成对应功能的代码,或者基于你前面/以前的代码给出后面/下一代码片段的补全建议。
刚开始装完VSCode CodeGeeX插件,写代码的时候,看不到任何反应,大概过了3秒钟之后,神奇的事情发生了,终于看到了代码提示内容。
我看网上的介绍,千篇一律使用的都是英文函数注释生成代码,国内程序员平常写代码,大多写的都是中文注释。为了使着顺手,测试一下,看它支不支持根据中文注释,生成代码片段,不支持的话就继续找。咱不整虚头巴脑,中看不中用的测试用例,写一个实实在在,能提高编码生产力的示例。用项目中实际用到的功能测试一下CodeGeeX的代码补全功能。
代码补全功能
写一个生成饼图的中文注释,不负期望,一会儿CodeGeeX就把用ECharts生成饼图的主体功能实现了, 微调一下就可以投入实际使用。不敢相信,免费的AI代码补全工具,功能都这么强大了。我本来还以为,免费的AI代码补全工具,都和TabNine一样,只能提示一行代码,现在看来,自己就是井底之蛙。果断卸载了TabNine。
CodeGeex 有三种模式:
自动模式
这是默认的模式,查看用户以前的代码或代码注释,为用户生成下一行代码。它不会干扰用户写代码。仅在用户输入3秒钟之后给出建议代码,而建议的代码在你按 Tab 键时才生效。之所以需要等待3s,是因为要和服务器通信,获取补全建议。存在多个候选的情况下,可以使用Alt/Option + [ 或 ] 在几个候选间进行切换。用户也可以在设置中改变’Candidate Num:。如果对现有建议不满意,可使用Alt/Option + N获得新的候选。
交互模式
按下 Control+Enter 会进入交互模式,VSCode 会分成两个版面。一个版面正常编写代码,另一个版面显示建议的代码片段。点击使用代码的时候会将提示代码填充到正常编写的代码中。在自动模式不工作的时候,可以按下Ctrl+Enter 组合键进入交互模式,继续获得提示,每按一次Ctrl+Enter, 产生一次提示。
提示模式
按下 ALT+T 进入提示模式,会给你提供一些代码解释,代码总结。使用提示 (Prompt) 模式,需要选中想要获得解释的代码,过一会儿,代码下方就会出现英文功能解释。这个模式只支持按照Java和Python两种语言的代码风格解释代码功能,个人觉得用处不大。
代码转换功能
CodeGeeX的另外一个功能是转换不同编程语言之间的代码。这个功能一般情况下用不上,如果能提供一个React和Vue代码互转的功能,那我们公司的项目就用得上。
有一个细节要注意,安装完CodeGeeX插件后,会弹出一个问询窗口,询问是否愿意将自己的代码共享到AI平台当做训练数据使用,记得点击拒绝,免得带来一些不必要的麻烦。
本以为这么好用又免费的AI代码补全工具可能比较稀缺,网上找了找,VSCode AI代码补全功能扩展还蛮多:
- Codeium 是一个人工智能驱动的代码完成工具。它支持超过20种语言,并与常用的IDE集成,个人用户永久免费。需要注册登陆后才能使用。
- Codiga 是一个平台,使开发人员能够更快地编写更好的代码。 开发人员可以使用Codiga编码助手直接从他们的 IDE 生成、分发和重用代码片段。
- CodeWhisperer 亚马逊的CodeWhisperer通过基于自然语言注释和集成开发环境 (IDE) 中的代码生成代码建议来提高开发人员的工作效率。
- Kite 是另外一种基于机器学习的代码自动补全插件。它的目标是帮助开发者更快地编写高质量的代码, Kite 支持超过16种语言以及16种代码编辑器。
- Captain Stack 它使用 Google传输用户的搜索查询,然后从 StackOverFlow 和 Github Gist 收集答案,为用户自动完成填充,这个过程中不使用 AI。
- IntelliCode 是一种在 GitHub 項目样本上训练的实验性AI编码辅助工具。
先收藏备用着,哪个以后收费了不能用了,就换成其它的。
后记
现在看来,中国媒体以前吹嘘的中国新四大发明, 美国媒体吹嘘的Web3.0-元宇宙都是噱头,ChatGPT掀起的这股科技浪潮,才是一次划时代的科技变革,必将影响深远。ChatGPT3.5的调试参数是1750亿个左右,ChatGPT4.0的调试参数已经骤升至100万亿左右,人的大脑皮层神经元数量是140-160亿之间,到达这个级别,智慧就会涌现。看到这么强大的工具,我不禁感慨,不是前端已死,而是程序员已死,程序员自己革了自己的命,以后编程的门槛会大幅降低,程序员的护城河将不复存在。百年未有之大变局。不过现在还能苟且一段时间,因为我发现ChatGPT3.5的数据是有滞后性的。问它有些问题,它就回答不了。如下图所示:ChatGPT4.0应该做了改进。另外AI补全代码的功能虽然强大,但只适合通用场景,要是开发一些定制化很强的业务代码,也很难给它描述清楚。此外,补全的代码仍旧需要人工Code Review和调试,现阶段AI还不能完全替代程序员。
本文正在参加「金石计划」