BinaryAI
BinaryAI 是腾讯安全科恩实验室基于在静态分析和AI安全领域的经验研发的二进制安全智能分析平台。其智能分析引擎可支持软件成分分析(SCA)和恶意软件分析,对用户上传的二进制文件,BinaryAI 可以在 GitHub 全量 C/C++ 库(上亿个 C/C++ 函数)范围中做相似性检索,以业界领先的识别准确率匹配到文件所使用的开源组件。
BinaryAI 是供个人用户免费试用的版本,可体验软件成分分析分析能力、函数相似性检索等核心引擎能力。腾讯云软件成分分析 是面向企业用户的版本,适合 DevSecOps 制品扫描、软件上线前安全风险识别、检查上下游供应链安全问题等应用场景。
如想了解私有化部署的解决方案,您可以通过邮件与我们联系:KeenSecurityLab@tencent.com。
如需使用SDK,请登录后从右上角进入“账号信息”创建API密钥,使用文档见:https://binaryai.readthedocs.io/。
产品概述
背景
近年来,开源软件成长迅速,已经成为软件开发的重要组成部分,这为全球广大开发者带来便利的同时,也形成了更多的暴露面。开源软件引发的安全问题揭示了两点问题:一是开源代码在面临漏洞时可能影响范围比商业软件更广,引用问题代码的软件都可能中招,造成极大的危害;二是开发人员的安全意识薄弱可能使代码碎片化程度高,引入过时、有漏洞的开源组件版本,因此需要一种有效的方法来保障软件的安全。
在这样的业务背景下,科恩基于自身应用与实践经验开发出 BinaryAI 产品——一款通过分析文件的二进制代码,以 AI 算法为核心能力的安全检测平台。通过分析文件的二进制代码,为用户提供二进制文件解析、软件成分分析等安全检测功能,解决二进制文件面临的检测困难,帮助安全研究人员分析文件组成,最后以清晰可读的网页报告呈现给用户,用于进一步分析文件的安全问题。
部署模式
BinaryAI 是一款提供纯 SaaS 服务的产品。用户无需安装任何硬件或软件,仅需按照文档的要求,上传提交二进制文件进行分析,降低了用户本地部署安装工具的使用门槛。
产品功能
文件上传分析
BinaryAI 支持分析:可执行文件、安装包、移动端应用及压缩包格式的二进制文件。
文件类型支持情况如下:
文件分类 | 文件类型 |
---|---|
可执行文件 | PE |
ELF | |
Mach-O | |
安装包 | Debian packages |
Red Hat packages | |
macOS setups | |
Windows setups | |
Java Archive | |
移动端包 | Android |
iOS | |
压缩包 | 7z、TAR、ZIP等常见压缩包格式 |
分区格式 | gpt |
dos | |
mac |
分析结果展示
BinaryAI 为用户提供细致、清晰的网页版报告,报告内容包括文件基本信息、软件成分分析、字符串信息等,帮助用户找到安全分析的着手点,提升分析效率。
① 基本信息:文件静态分析的初步结果
- 区分文件所需的基本信息,包括文件名、大小、类型、上传/分析时间、哈希值
- 文件基本分析结果,包括文件头、段、符号、安全保护机制打开情况或包格式文件解压情况
② 软件成分分析:提取已知第三方库特征,识别所包含的各类第三方库和版本号,向用户提供组件清单
- 第三方库组件名称
- 第三方库组件版本号
- 第三方库组件基本信息
③ 字符串信息:提供文件包含的 ASCII 字符串
④ 函数相似性检索结果:基于科恩自研函数相似度模型BAI-2.0及基于复杂图的程序分析算法,可对可执行文件中的二进制函数在Github全量 C/C++ 库中找到匹配的源代码函数。支持网页上进行交互式分析和导出Json文件两种使用方式。
自定义比对
用户可以在网页上直接将一个二进制文件与另一个二进制文件进行比对分析,也可以指定开源组件项目范围或选择全量开源组件,让二进制文件在该组件范围进行函数匹配。 页面上可以直接查看自定义比对任务的命中结果,也可以点击交互式分析,跳转到交互式分析页面查看比对情况。
快速入门
上传分析
- 访问产品上传页面,点击上传并选择本地文件或拖拽文件到指定方框区域
- 等待文件分析完成(如果文件未分析,需要等待 30s - 5min 的时间,具体情况视提交队列消耗速度而定)
- 查看网页版分析结果
下载函数相似性检索结果
- 点击 Interactive Analysis(交互式分析) 按钮进入交互式分析页面。
- 点击 Export(导出) 按钮,下载该文件的函数相似性检索结果 Json 文件
- 使用 BinaryAI 提供的插件脚本,将 Json 文件导入 IDA Pro、Ghidra
- 在本地客户端软件继续二进制文件分析
文件样例
用户可以查看如下几个文件样例:
软件成分分析和函数识别
威胁情报案例(C2样本检测)
威胁情报案例(挖矿样本检测)