GitHub 免费提供机器学习扫描代码漏洞，现已支持 JavaScript / TypeScript - 果核剥壳

2022年3月10日下午11:46 • 圈内新闻

GitHub 更新一项实验版新功能。用上机器学习后，新版 CodeQL 代码扫描服务可以帮开发者发现更多安全漏洞。

目前在 JavaScript 和 TypeScript 存储库上开发测试，以后会逐步增加各种语言支持。

在测试期间，CodeQL 已经从 12,000 个存储库中发现了超过 20,000 个安全问题，包括远程代码执行（RCE）、SQL 注入和跨站脚本（XSS）漏洞。

如何使用

GitHub 的 CodeQL 代码扫描对于公共存储库是免费的。

目前，新的 JavaScript / TypeScript 分析工具，已向 security-extended 和 security-and-quality 分析套件的所有用户推出。

如果你已经在使用这些套件，那么将自动使用新的机器学习技术进行分析。

如果你之前没使用过，可按照以下步骤启用 CodeQL。

在你的存储库主页下，单击 Security。

在 Code scanning alerts 右侧，点击 Set up code scanning。如果缺少这一项，需要由存储库管理员启用 GitHub 高级安全性。

在“Get started with code scanning”下，单击在 CodeQL Analysis 中的 Set up this workflow。

使用 Start commit 下拉菜单，输入文件名并提交。

选择直接提交到默认分支，还是创建一个新分支并启动拉取请求。

单击提交新文件。

代码扫描分析成功后，用户将在“Security”选项卡中看到安全警报信息。

为何用 ML 能产生更好效果

为了检测存储库中的漏洞，CodeQL 引擎首先构建了一个数据库，对代码的特殊关系表示进行编码，然后在数据库上执行一系列 CodeQL 查询。

但随着开源生态系统的快速发展，长尾效应越来越明显。

安全专家不断扩展和改进这些查询，对其他常见库和已知模式进行建模。然而，手动建模很耗时，而且总会有一些无法手动建模的不太常见的库和私有代码。

这时候机器学习就派上了用场。通过给定大量训练代码片段，每个查询都标记为正面或负面样本，为每个片段提取特征，并训练深度学习模型对新示例进行分类。

GitHub 不是将每个代码片段简单地视为一串单词或字符，直接应用标准 NLP 技术对这些字符串进行分类，而是利用 CodeQL 访问有关底层源代码的大量信息，为每个代码片段生成一组丰富的 feature，然后像 NLP 那样对它们进行标记和子标记。

由此从训练数据中生成一个词汇表，并将索引列表输入到深度学习分类器中，输出当前样本是每种漏洞的概率。

虽然现在基于 ML 的漏洞扫描仅适用于 JavaScript / TypeScript，但 GitHub 承诺未来会支持更多语言，现在 CodeQL 已经支持了 Python、Go、C / C++ 在内的多种流行语言。

最后，GitHub 还强调，虽然全新工具可以发现更多漏洞，但也有可能提高误报率（召回率约为 80%，精度约为 60%）。未来这项功能会随着时间推移而改善。

图文@量子位

如果您喜欢本站，点击这儿不花一分钱捐赠本站

这些信息可能会帮助到你：下载帮助 | 报毒说明 | 进站必看

修改版本安卓软件，加群提示为修改者自留，非本站信息，注意鉴别

赞 (2)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

上海交大发布「人类行为理解引擎」：深度学习 + 符号推理，AI 逐帧理解大片中每个动作

上一篇 2022年3月10日下午8:39

史诗级改动！百度贴吧网页端查看评论不再跳转App

下一篇 2022年3月11日上午1:48

发表回复

messier104 2026年6月27日

stellarium v26.2 发布了下载地址如下 https://cors.isteed.cc/https://github.com/Stellarium/stellarium/releases/download/v26.2/stellarium-26.2-qt6-win64.exe

评论于 Stellarium(虚拟天文馆) v26.1
zyw3501 2026年6月27日

返映个问题提个建议竞被删帖了

评论于 Chromium v151.0.7913.0 绿色版
lijia07 2026年6月27日

语文更新了，数学更新吗？

评论于 Ventoy v1.1.16 开源多合一启动盘工具
sjsj 2026年6月27日

对，也没有课程单元里的语音通话

评论于 Android 多邻国 v6.84.2 高级版
118745 2026年6月27日

下载7zip，或者改成rar

评论于 Microsoft Edge v149.0.4022.96 便携增强版
jiashao168 2026年6月27日

问题是现在看运动的人也越来越少了，比如我

评论于比尔·盖茨谈 AI 就业冲击：运动员成为第四类“不可替代”职业
冷血 2026年6月27日

win10环境，时不时会闪退

评论于 Google Chrome v149.0.7827.201 便携增强版
350320 2026年6月27日

好久没更新了，现在会闪退

评论于 Android 每日英语听力v10.0.2 修改版
Sumire 2026年6月27日

OpenArk 是 Windows 内核级的分析工具，相关操作有大概率触发杀软误报，所以你需要理解自己在干什么而不是盲信 360

评论于 OpenArk(开源Ark工具) v2.0.0
白嫖之神 2026年6月27日

在等豆包输入法的WIN版本，等有了立刻卸载搜狗

评论于搜狗拼音输入法 v16.6.0.4073 去广告安装版