目录探测、指纹识别
欢迎使用任何同类型工具进行准确性和误报对比。
作者VX:chainreactor
-
2025/12/11
1、修复主动指纹扫描下的并发问题,解决堵塞卡顿等问题。@#IWenxxx 2、新增主动指纹识别指示器,打印主动指纹识别进度。 3、新增扫描前目标有效性检查,筛选剔除无效URL与重复路径等问题。 4、新增主动指纹识别探测逻辑,会根据目标URL层级进行递归主动目录探测(不包括404页面探测)。 5、新增目录扫描实时输出,针对目标进行结果即时打印。 -
2025/12/09
1、优化被动扫描报告输出方式和逻辑。 2、新增目录递归扫描,协助发现更多隐藏页面。 3、模块统一使用fasthttp库,提升扫描速度,节省网络开销。 4、修改指纹规则加载逻辑,采用云端加载方式,通过--update-rules更新指纹。 5、新增漏洞扫描专项字典,协助快速发现历史0/1/N漏洞。 6、新增参数--no-filter,用来关闭相似页面过滤功能。 -
2025/12/06
1、删除端口扫描模块(后期可能会重构后再次开放) 2、优化控制台输出格式,更清晰简单易读 3、新增指纹规则,目录字典 4、新增跳转跟随规则,适配更多跳转场景 5、优化扫描性能,提升扫描速度。 -
2025/12/02
1、修复指纹识别规则匹配BUG 2、优化无效页面过滤算法 3、优化被动扫描采集URL逻辑 -
2025/11/20
1、优化目录扫描/指纹识别模块HTTP跟随跳转功能,针对状态码返回200,内容为JS/HTML跳转场景进行多种适配,使用正则进行匹配。 2、优化代码架构,更合理更高效更已读,各模块解偶设计,互相独立,不相互依赖。 3、大幅优化目录扫描误报率,无效页面过滤算法更加精准。 4、设计API接口,后续支持通过Web API进行调用。 5、更新指纹规则库、目录扫描字典。 -
2025/11/14
1、修复模块运行顺序与调用问题。 2、完善主动/被动指纹识别准确性。 3、新增springboot专项扫描字典。 4、指纹识别规则新增多path路径请求。 -
2025/11/05
1、优化扫描工作流流程:端口扫描->识别到http/https服务->被动指纹识别->主动指纹识别->目录扫描->无效页面/相似页面过滤->输出结果。 2、新增目录扫描错误判断,出现多次“connection refused”,中止扫描并丢弃目标。 3、提升端口扫描速度。 4、优化目录扫描302跳转判断逻辑,默认不进行跟随跳转。 -
2025/11/03
1、修复被动扫描下,域名匹配问题。 2、新增存活检测进度显示,优化存活检测并发,提升检测速度。 3、端口扫描新增常用Web端口,常用服务端口、top5000端口未指定端口范围时,默认扫描常用Web端口,也可使用-p all,top5000,web 4、修复目录扫描302跳转判断逻辑。 5、新增指纹信息与目录字典。 6、新增端口扫描结束后自动判断服务协议,满足http/https则开启新一轮指纹识别->目录扫描。 -
2025/10/31
1、新增端口扫描模块:-m port -u 10.0.0.0/24 -p 80,443 2、新增参数-na,用来取消目录扫描/指纹识别前的目标存活检测,默认关闭。 3、新增参数-sV,用来进行端口扫描结果的服务识别,默认关闭。 -
2025/10/29
1、目录扫描新增{{sub_domain}}标识符,用来对目标域名进行拆分进行拼接扫描。 2、新增端口扫描模块,与指纹识别,目录扫描模块完全分离,插件化实现,可实现高精度的扫描,准确度与速度较为均衡。 3、新增--rate参数,-p参数,用来指定端口扫描的速率以及扫描端口的范围。命令行包含-p参数才会运行端口扫描模块。 -
2025/10/28
1、修改字典加载模式,默认只加载common.txt字典,剩余字典需用户-w指定。支持多文件选择,例如-w dict/common.txt,dict/xxx.txt 2、新增-vv参数,对指纹识别/敏感信息识别内容提取高亮,方便查看匹配的具体特征上下文。 3、精简配置config.yaml配置文件,修改为命令行接收配置参数。 4、新增优化指纹信息和目录字典。 5、优化404探测指纹显示方式,统一进行指纹显示的合并。 6、新增execl报告输出。 7、新增-nc参数:取消控制台颜色输出,防止windows系统下乱码的情况。 8、新增--json参数:控制台输出结果变为纯json结果输出,方便其他工具接收输出作为第三方工具的输入。
互联网那么多开源的同类型工具,为什么还要重复造轮子。
目前许多优秀的工具基本都有以下几点问题:
1、无效页面的过滤不精准,类似状态码200,实际内容返回404的这种情况,以及泛页面情况的出现,如何准确过滤掉是个问题。
2、不支持被动的目录扫描或者指纹识别,很多有效的目录或者指纹信息往往在二级甚至三级目录下,如何有效的提取到有效目录进行扫描,以及如何主动访问某些目录来去进行主动的指纹识别。
3、字典以及规则库臃肿,参考互联网多数项目的字典和规则库,经过精简剔除后,3000条目的规则或字典往往只有1000条是真实有效有价值的。
4、杂乱的多线程设计,许多扫描器在进行大范围扫描时,会出现假死卡顿等现象,往往在扫描过程中没有实施检测进度以及及时的丢弃目标导致。
被动扫描时,首次使用请解压ca-cert.zip安装证书。
# 目录扫描 + 指纹识别 (默认配置,使用内置字典)
./veo -u http://target.com
# 批量目录扫描 + 指纹识别
./veo -l target.txt --stats
# 使用自定义字典、输出 JSON 报告
./veo -u http://target.com -w dict/custom.txt -o report.json
# 使用自定义字典、输出 Excel 报告(包含两个工作表:有效结果和全部结果)
./veo -u http://target.com -w dict/custom.txt -o report.xlsx
# 递归目录扫描(深度为2层)
./veo -u http://target.com --depth 2
# 禁用哈希过滤,显示所有扫描结果
./veo -u http://target.com --no-filter
# 自定义状态码过滤
./veo -u http://target.com -s 200,301,302,403
# 仅指纹识别
./veo -m finger -u http://target.com
# 仅目录扫描
./veo -m dirscan -u http://target.com
# 显示指纹匹配规则和匹配片段
./veo -u http://target.com -vv
# 使用自定义 HTTP 头部
./veo -u http://target.com --header "Authorization: Bearer token123" --header "X-API-Key: key456"
# 控制台输出 JSON 格式(配合管道使用)
./veo -u http://target.com --json
# 更新指纹识别规则库
./veo --update-rules
# 被动扫描(默认监听端口9080)
./veo -u http://target.com --listen -lp 8090| 参数 | 默认值 | 说明 | 示例 |
|---|---|---|---|
-u |
必填或 -l |
目标列表,逗号分隔。支持完整 URL、域名、host:port、CIDR、IP 范围。 |
-u http://a.com,https://b.com |
-l |
— | 目标文件路径,每行一个目标;支持注释 # 和空行。 |
-l targets.txt |
-m |
finger,dirscan |
启用的模块,逗号分隔:finger 指纹识别,dirscan 目录扫描。 |
-m finger |
--listen |
false |
启用被动代理模式(监听 HTTP 流量),默认主动扫描。 | --listen |
-lp |
9080 |
被动代理监听端口,仅在 --listen 模式下使用。 |
-lp 8080 |
| 参数 | 默认值 | 说明 | 示例 |
|---|---|---|---|
--debug |
false |
启用调试日志,输出 [DBG] 级别信息。 |
--debug |
--stats |
false |
显示实时扫描统计(适用于长时间任务)。 | --stats |
-v |
false |
显示指纹匹配规则内容(不含片段)。 | -v |
-vv |
false |
显示指纹匹配规则及匹配片段详情。 | -vv |
-nc, --no-color |
false |
禁用彩色输出,适用于不支持 ANSI 的终端。 | --no-color |
--json |
false |
控制台结果以 JSON 输出。 | --json |
-nc |
false |
启用存活性检测 (默认关闭)。 | -nc |
-ua |
true |
是否启用随机User-Agent池,可通过 -ua=false 关闭。 |
-ua=false |
| 参数 | 默认值 | 说明 | 示例 |
|---|---|---|---|
-t, --threads |
200 |
全局并发线程数(请求处理、目录扫描等)。 | -t 100 |
--retry |
1 |
失败重试次数。 | --retry 3 |
--timeout |
3 秒 |
全局请求超时时间。 | --timeout 10 |
| 参数 | 默认值 | 说明 | 示例 |
|---|---|---|---|
-w |
config/dict/common.txt |
指定自定义目录扫描字典文件(多文件可逗号分隔)。 | -w dict/common.txt,dict/admin.txt |
--depth |
0 |
递归目录扫描深度,0 表示关闭递归。 | --depth 2 |
| 参数 | 默认值 | 说明 | 示例 |
|---|---|---|---|
-o, --output |
— | 结果输出到文件,支持 .json, .xlsx。Excel 报告包含两个工作表:过滤结果和全部结果。 |
-o report.xlsx |
--json |
false |
控制台输出 JSON,便于与其他工具集成。 | --json |
| 参数 | 默认值 | 说明 | 示例 |
|---|---|---|---|
--header |
— | 自定义 HTTP 头,可多次指定。格式:"Header-Name: Header-Value"。 |
--header "Authorization: Bearer xxx" |
-s |
200,403,500,302,301,405 |
保留的 HTTP 状态码列表,逗号分隔。 | -s 200,301,302 |
--no-filter |
false |
完全禁用目录扫描哈希过滤,显示所有响应。 | --no-filter |
--proxy |
— | 设置上游代理,支持 HTTP/SOCKS5 代理。 | --proxy http://127.0.0.1:8080 |
| 参数 | 默认值 | 说明 | 示例 |
|---|---|---|---|
--update-rules |
false |
从云端更新指纹识别规则库。 | --update-rules |
默认配置位于 config/config.yaml,主要分为以下模块:
server:
listen: ":9080" # 被动扫描时,监听的端口
hosts:
allow: # 被动扫描时默认允许的主机
- "*"
reject: # 被动扫描时默认拒绝的主机
- "*.baidu.com"
- "*.google.*"allow/reject控制可访问的目标域,支持通配符。
addon:
collector:
GenerationStatusCodes: [200, 403, 401, 500, 405]
static:
path: ["/css/", "/js/"]
extensions: [".css", ".js", ".png", ...]GenerationStatusCodes:被动扫描时,仅采集符合状态码的URLpath:过滤静态目录extensions:过滤静态文件
addon:
filter:
enable: true
ValidStatusCodes: [200, 401, 403, 405, 302, 301, 500]
filter_tolerance: 50ValidStatusCodes:目录扫描过滤的状态码filter_tolerance:相似页面容错字节数(默认 50 字节)。- 支持开启/关闭主要哈希、二次哈希过滤。
addon:
request:
timeout: 5
retry: 2
threads: 200
max_response_body_size: 1048576timeout:单请求超时时间(秒)。retry:重试次数threads:最大并发数。max_response_body_size:响应体限制大小(防止内存占用过大)。
- 状态码过滤:默认白名单
200/301/302/401/403/405/500,可覆写。 - 静态资源过滤:根据 Content-Type / 扩展名排除图片、视频等页面。
- 主要哈希过滤:剔除重复或异常页面,默认阈值 3。
- 二次哈希过滤:对相似页面进行去重,默认阈值 1。
- 相似页面容错:默认 50 字节,可通过配置文件或 SDK 参数调整。
- 认证头探测:对 401/403 响应自动提取认证信息,携带认证扫描,出货率更高。
- 指纹识别:解压 gzip/deflate/brotli,自动识别编码,执行 DSL 规则,输出
<rule_name>与<rule_content>。
确保 go.mod 中引用本仓库:
go get github.com/pphuahua/veo/pkg/sdk/scanpackage main
import (
"fmt"
"log"
"time"
"veo/pkg/sdk/scan"
)
func main() {
dirCfg := scan.DefaultDirscanConfig()
dirCfg.MaxConcurrency = 150
dirCfg.RequestTimeout = 8 * time.Second
dirCfg.EnableReporting = false
dirCfg.Filter = &scan.DirscanFilterOptions{
ValidStatusCodes: []int{200, 301, 302, 401, 403, 405, 500},
InvalidPageThreshold: scan.Int(3),
SecondaryThreshold: scan.Int(1),
FilterTolerance: scan.Int64(50),
}
fpCfg := scan.DefaultFingerprintConfig()
fpCfg.MaxConcurrency = 150
fpCfg.MaxBodySize = 2 * 1024 * 1024
fpCfg.LogLevel = "debug"
autoSkip := true
cfg := &scan.Config{
DirTargets: []string{"http://x.x.x.x/"},
FingerprintTargets: []string{"http://x.x.x.x/"},
SkipTLSVerify: false,
AutoSkipTLSForIP: &autoSkip,
HTTPTimeout: 20 * time.Second,
Dirscan: dirCfg,
Fingerprint: fpCfg,
}
resultJSON, err := scan.RunJSON(cfg)
if err != nil {
log.Fatalf("扫描失败: %v", err)
}
fmt.Println(string(resultJSON))
}| 字段 | 说明 |
|---|---|
DirTargets / FingerprintTargets |
目录扫描和额外指纹识别 URL 列表 |
SkipTLSVerify / AutoSkipTLSForIP |
TLS 校验策略,裸 IP 默认自动跳过 |
HTTPTimeout |
RequestProcessor 的请求超时 |
Dirscan.Filter |
状态码、哈希阈值、容错等过滤参数 |
Fingerprint.Filters |
静态资源过滤选项 |
辅助函数 scan.Bool / scan.Int / scan.Int64 用于快速传入指针参数。
欢迎提交 Issue/PR。