钱包聚类入门:当50个钱包背后是同一个交易者
钱包聚类入门:当50个钱包背后是同一个交易者
如果你追踪“顶级钱包”足够久,就会发现一个规律:
那些最一致的“钱包”根本不是钱包,而是操作者。
一个交易者可以将活动分散到几十个地址中,目的是:
- 减少关注度
- 分摊限额或操作风险
- 策略分离(一个钱包用于对冲,一个用于事件驱动)
- 操纵按钱包排名的仪表盘
如果你不考虑这一点,就会:
- 高估独立信号数量(50个“巨鲸”其实是一个)
- 夸大或低估胜率(盈利和亏损分散在各个地址)
- 错误校准警报(你会以为市场有“广泛的聪明钱共识”,其实只是一个集群)
内部链接:
- 聪明钱概览:/smart-money
- 聪明钱集合:/smart-collections
1) “聚类”的含义(以及它不含义)
聚类是一个假设:这些地址由同一个实体控制。
在比特币研究中,聚类启发式通常依赖于交易图结构(例如多输入启发式)。一篇经典的早期论文使用启发式方法在共享权威下对地址进行分组,然后通过再识别来标记集群。 来源:Meiklejohn 等,《A Fistful of Bitcoins》(IMC 2013)。https://cseweb.ucsd.edu/~smeiklejohn/files/imc13.pdf
但启发式可能出错。后来的工作关注错误率和当假设失效时的错误聚类(找零地址检测、地址重用模式等)。 来源:《Analyzing the Error Rates of Bitcoin Clustering Heuristics》。https://inria.hal.science/hal-05315736v1/document
Polymarket 的聚类有所不同,因为:
- 你关心的是交易场所上的行为(CLOB + 头寸),而不仅仅是 L1 UTXO 结构
- 操作者可以在多个地址上表现一致,而无需明显的链上“多输入”关联
因此,我们首先使用行为聚类,仅将链上资金流作为佐证。
2) 实用的特征集(适用于 Polymarket)
你可以将聚类视为一个评分问题:每个特征都增加证据。
特征 A——时间同步(“节拍器”)
如果两个钱包反复:
- 在几分钟内同时入场
- 交易相同的结果
- 跨越多个市场
那么它们不是独立的。
指标:
sync_score = 交易中 |t_i - t_j| < Δt 且同边同市场的比例
根据市场节奏设置 Δt:
- 加密货币:1–3 分钟
- 政治/新闻:5–15 分钟
特征 B——市场重叠(“投资组合指纹”)
计算交易市场的 Jaccard 相似度:
jaccard = |M_i ∩ M_j| / |M_i ∪ M_j|
高重叠本身不够(很多人交易热门市场),但重叠加时间同步则很有力。
特征 C——方向一致性(“观点签名”)
对于每个钱包,构建一个符号敞口向量:
- +1 表示 YES 净积累
- -1 表示 NO 净积累
- 按名义金额或持仓时间加权
然后计算钱包之间的余弦相似度。
这可以捕捉“总是反向”与“总是动量”的风格。
特征 D——执行风格(做市商与吃单方偏好)
两个钱包如果:
- 使用相似的订单大小
- 表现出相似的激进程度
- 在距中间价相似的距离执行
通常共享一个执行引擎或操作者。
你可以使用 CLOB 订单簿快照(价差/冲击代理)并将实际成交价与当时中间价进行比较来量化。 来源:Polymarket API(CLOB/Gamma/Data)端点概述。https://docs.polymarket.com/quickstart/reference/endpoints
特征 E——资金流(佐证,非主要)
如果多个地址的资金来自:
- 同一个源地址
- 相同的交易所存款模式
- 一个共同的“金库”钱包
那是强有力的证据。
但这并非必需;老练的操作者会刻意避免可追溯的资金模式。
3) 聚类如何改进警报(并减少噪音)
大多数警报系统...
发布于: 2026年6月23日 · 8 分钟 · SightWhale