La loi de Benford dit que dans beaucoup de jeux de données naturels, le chiffre 1 apparaît comme premier chiffre environ 30 % du temps, le 2 environ 17 %, etc. Quand une distribution s'écarte de cette loi, c'est souvent le signe d'une manipulation.
L'idée
J'ai voulu appliquer ça aux volumes de trading crypto. Si une paire a des volumes qui ne suivent pas Benford, c'est peut-être du wash trading ou de la manipulation de marché.
L'outil
Un script Python qui :
- Récupère les volumes horaires des 500 principales paires sur plusieurs exchanges.
- Calcule la distribution des premiers chiffres.
- Compare avec la distribution théorique de Benford via un test du chi-carré.
- Attribue un score de "naturalité" à chaque paire.
Les résultats
Sans surprise, les paires les plus liquides (BTC/USDT, ETH/USDT) suivent bien Benford. Par contre, certaines altcoins à faible capitalisation montrent des déviations flagrantes — souvent corrélées avec des pics de volume suspects.
Les limites
Benford n'est pas une preuve de fraude. C'est un signal. Certaines distributions légitimes ne suivent pas la loi (prix bornés, petits échantillons). Mais comme filtre initial pour repérer les paires à éviter, c'est redoutablement efficace.