Triton Digital utilise des techniques basées sur les identifiants, l'activité et les modèles des données dans les fichiers journaux, afin d'identifier et de filtrer (exclure) les activités non-valides. L'activité non valide comprend, sans s'y limiter, l'activité non humaine connue et suspectée et l'activité humaine non valide suspectée. Cependant, l'identification et l'intention de l'utilisateur ne peuvent pas toujours être détectées ou décodées par le réseau, l'annonceur ou leurs agents respectifs, et il est peu probable que toute activité non valide puisse être identifiée et exclue des résultats du rapport Les détails de nos techniques sont décrits ci-dessous.
Règle Une minute
En raison de la nature de l’activité de streaming et du comportement général du trafic lié aux robots/araignées, nous avons mis en place un processus selon lequel des séances de streaming d’une durée inférieure à une minute sont considérées comme non-valides et sont retirées de toutes données de mesures collectées, sauf si la longueur de l'épisode/fichier est également inférieure à une minute, auquel cas le fichier complet est téléchargé. Cette règle réduit le bruit des sessions extrêmement courtes, des activités robotiques et des problèmes de connectivité initiaux.
Si les informations nécessaires pour mesurer la longueur du contenu téléchargé ne sont pas disponibles, nous appliquons des facteurs d'ajustement pour supprimer les sessions courtes équivalentes. Ce processus a été vérifié par le laboratoire technique de l'IAB.
Identification spécifique d'activité non-humaine
Triton Digital utilise la liste noire internationale IAB/ABCe Spiders and Bots 1 afin d'exclure des données collectées le trafic du site associé à une activité robotique. Par exemple, ce processus de filtrage nous permet d'exclure les requêtes http émanant des araignées des moteurs de recherche (y compris de Google, Bing, Yahoo, etc.). Cette liste est alimentée par l'Interactive Advertising Bureau (IAB) et mise à jour mensuellement.
Des listes supplémentaires sont utilisées et mises à jour par Triton Digital afin d'exclure des agents utilisateurs non valides ou d'inclure des agents utilisateurs valides connus, si ces agents ne sont pas reflétés à temps dans la liste des araignées et robots internes de l'IAB/ABCe.
Triton Digital respecte aussi les conseils de filtrage de l'IAB concernant les téléchargements watchOS d'Apple, car la majorité des téléchargements watchOS sont des duplications automatisées des téléchargements de l'iPhone et ne sont pas initiés par l'utilisateur. En particulier, nous filtrons :
- Agents de l'utilisateur qui commencent par atc/ et incluent watchOS (par exemple : atc/1.0 watchOS)
- Agents de l'untilisateur contenant (null)/(null) watchOS*.
Exclusion du centre de données
Triton Digital utilise la liste d'adresses IP du centre de données TAG afin d'exclure le trafic non humain identifié par le secteur du centre de données. Cette liste est maintenue par le Trustworthy Accountability Group (TAG) et mise à jour chaque mois.
Demandes incorrectes ou non identifiées
Triton Digital accepte uniquement les demandes de transfert de fichiers valides telles que GET avec les codes d'erreur 200 et 206 et avec une plage d'octets valide. Les demandes de fichiers qui ne peuvent pas être identifiés comme appartenant à un podcast/programme ne seront pas crédités à un épisode, podcast ou programme.
Duplication de données
Toutes les données dupliquées sont supprimées de l'ensemble de données utilisées pour produire les indicateurs finaux.
Autre filtrage basé sur l'activité
Triton peut signaler le trafic comme étant non-valide sur la base de modèles de trafic anormaux ou suspects, déterminés par des règles de filtrage basées sur l'activité. Dans les cas où le trafic suspect a été supprimé, Triton peut ajuster la période de rapport et les moyennes hebdomadaires correspondantes.