Exigences relatives aux journaux de podcast

Précédent Suivant

Livraison et fréquence des fichiers journaux

Les fichiers journaux sont extraits par Triton Digital depuis le S3, FTP ou SFTP (point de collecte) du client. Les éditeurs doivent fournir des identifiants nécessaires afin d'obtenir les fichiers journaux.

Les fichiers journaux doivent atteindre le point de collecte au moins une fois par jour, mais ils peuvent être plus fréquents, surtout si les fichiers sont plus gros et en plusieurs morceaux.  Triton Digital s'attend à recevoir les informations de la session dans les trois jours suivant le début de la session. Si le journal de session est reçu après ce délai, il ne sera pas pris en compte dans les mesures agrégées.

Nom du fichier

Les fichiers journaux doivent porter un nom unique, la date faisant partie du nom du fichier. Chaque fichier nommé doit arriver au point de collecte lorsque le journal est terminé (plutôt que l'ouverture du FTP dans le dossier de journalisation où les fichiers sont en cours d'écriture active). Chaque nom de fichier unique sera récupéré/traité une seule fois. Un exemple d'un nom de fichier approprié à cette fin est : MSLT20150830-00.tsv.gz, où 20150830 est la date, et -00 est un suffixe, si nécessaire, pour l'heure, le numéro de fichier de cette date, ou une autre valeur de séquençage/d'identification unique.

Pour des raisons d'efficacité, chaque fichier journal doit être compressé dans une archive à fichier unique « .gz ».

Persistence

Créer une tâche de nettoyage pour supprimer les fichiers de connexion qui ont été créés il y a plus de 60 jours. Par exemple, si vous utilisez le stockage Amazon S3, vous pouvez ajouter une règle de cycle de vie à votre espace de stockage mémoire pour ce faire.

Format du fichier

Les fichiers journaux doivent être dans l'un des formats suivants :

  1. Format de sortie standard du serveur du fichier.  La sortie par défaut du journal d'accès de la plupart des services de streaming audio actuels est souvent utilisable, et ce, sans modification de la configuration.
  2. Format selon le format de journaux étendu W3C (https://www.w3.org/TR/WD-logfile-960221.html). Ce format est couramment utilisé pour la sortie du serveur de streaming. Il s'agit essentiellement d'un fichier délimité par des tabulations ou des espaces avec un en-tête qui identifie les noms des champs pour chaque colonne des données.
  3. Format sous la forme de valeurs séparées par des tabulations (tsv). Détails : Caractère de tabulation (comme \t ou 0x09). Fin de ligne (\n ou 0x0A). Le caractère de la ligne commentée. La ligne d'en-tête est idéale mais facultative. Si ce format est utilisé, veuillez contacter votre gestionnaire de compte Triton Digital et lui fournir les informations concernant le format/les champs de sortie prévus afin que nous puissions nous assurer de la bonne correspondance à un schéma d'analyse de fichiers journaux.
  4. Pour ceux qui utilisent le CDN Akamai, ce format de fichier Luna doit être utilisé :
    Format de fichier Extended + Completion Flag Log :
    date_YYYY-MM-DD \t time_HH:MM:SS \t client_ip \t http_method \t arl_stem \t status_code \t total_bytes \t transfer_time \t "referrer" \t "user_agent" \t "cookie" \t total_object_size \t byte_range \t last_byte_served_flag

Champs obligatoires et facultatifs des lignes de journaux

Champs obligatoires (Logs)Description

IP

Adresse IP publique distante de l'appareil du client. Cela peut être soit IPv4 soit IPv6. Il peut s'agir de l'adresse IP complète (par exemple, 200.150.100.111) ou d'une adresse IP partielle (tronquée) avec 0 comme dernier chiffre (par exemple, 200.150.100.0). S'il s'agit d'une adresse partielle, nous devons également recevoir l'adresse IP hachée dans un champ supplémentaire. L'adresse IP hachée est nécessaire pour maintenir un nombre correct de téléchargements et de valeurs uniques.

Adresse IP hachée

Hachage de l'adresse IP avec n'importe quel algorithme standard de fonction de hachage (par ex., MD5). La méthode de hachage doit réduire le risque de conflit et ne doit pas être communiquée. L'adresse IP hachée est utilisée pour dénombrer correctement les téléchargements uniques et les auditeurs uniques lorsque l'adresse IP est tronquée. (Voir le champ IP.)

user-agent

Contenu de l'en-tête HTTP « agent d'utilisateur ». Cet en-tête HTTP d'agent utilisateur contient une chaîne de caractères qui permet aux pairs du protocole réseau d'identifier le type d'application, le système d'exploitation, le fournisseur de logiciel ou la version du logiciel de l'agent utilisateur du logiciel demandeur.

Exemple : Mozilla/5.0 (Windows NT 10.0 ; Win64 ; x64)

date

Date à laquelle la transaction est conclue. Le format est AAAA-MM-JJ.

start-time

Horodatage du début de la session. Le format est HH :MM:SS

method

Ex. de méthode HTTP : GET

status

Ex. de code d'état HTTP : 200

url

URI (ou URL) complet allant jusqu'à 2048 caractères. Cette valeur doit être renseignée avec un point de publication unique (URI), de façon à ce que l'enregistrement puisse être appliqué à cette station dans notre système. En d'autres termes, une partie de ce champ sera utilisée comme clé de correspondance avec une station de la base de données de Triton Digital.

Exemple : /FolderABC/2018/02/20180209_pine0823.mp3?siteplayer=true&episode=588472

bytes

Octets transférés ou taille de réponse, du serveur au client. Ex. : 766967

object-size

Taille totale du fichier de podcast à télécharger.

byte-range

Des données devraient être disponibles si le code de réponse est 206. Ex. : 2008-19568

Optional Fields

Description
(Notez que ces champs peuvent être indépendants ou, dans certains cas, positionnés dans les paramètres de requête URI d'origine)

referrer

Adresse de la page Web précédente à partir de laquelle un lien vers la page actuellement demandée a été suivi.

time-taken (duration)

Numérique, jusqu'à neuf chiffres. Ceci est la durée de la session d'écoute, en secondes entières.

episode-guid

Identifiant GUID de l'épisode, tel qu'indiqué dans le flux RSS. Si cette valeur est présente, elle peut substituer l'URI comme clé de correspondance avec un épisode dans le flux RSS.

podcast-id

Identifiant du podcast (émission) où l'auditeur a commencé une session d'écoute.

vid

Identifiant d'enregistrement/de visiteur unique qui peut être utilisé pour identifier un auditeur et qui doit provenir du mécanisme d'enregistrement de l'auditeur.

lsid

Le LSID Triton Digital (autrement dit, l'UUID). Il s'agit de l'identifiant de l'application/cookie/publicité tel qu'il est présenté dans la rubrique Gestion de l'identifiant de l'auditeur de la spécification technique de la publicité. En règle générale, sur un appareil mobile, il doit s'agir d'un « GAID » de Google ou d'un « IDFA » d'Apple, ou s'il n'est pas disponible, d'un identifiant généré par l'application. Sur les ordinateurs de bureau, il doit s'agir d'un identifiant de cookie.

sexe

Sexe d'un auditeur (M, F ou U). U peut être utilisé pour « autre » ou sexe « inconnu ».

yob

Année de naissance de l'auditeur, selon le format AAAA.

age

Âge de l'auditeur.

code postal

Code postal de l'auditeur (code à 5 chiffres ou code alphanumérique sans espace).

hasads

Indication signalant si la session d'écoute peut recevoir de la publicité. Les valeurs possibles sont 0 et 1. L'envoi de 0indique que la session ne peut pas recevoir de publicité.

dev

Propriété supplémentaire utilisée pour spécifier sur quel périphérique la session est lancée. Triton Digital peut établir une liste non exhaustive des dispositifs disponibles, mais les clients peuvent compléter cette liste selon leurs propres besoins.

dist

Propriété supplémentaire qui peut être utilisée pour générer un regroupement indiquant sur quel distributeur/partenaire la session a été lancée. Par exemple, l'éditeur A partage son flux sur le distributeur/partenaire B, donc la propriété Distributeur est « B ». Triton Digital peut fournir une liste non exhaustive des distributeurs disponibles, mais les clients peuvent compléter cette liste selon leurs propres besoins.

ss

Propriété supplémentaire qui peut être utilisée pour générer un regroupement indiquant l'éditeur du flux. Par exemple, l'éditeur A partage son flux avec le partenaire B, donc la propriété du ss est « A ». Cette méthode est rarement utilisée, car les journaux sont généralement produits par l'éditeur.

ps

Propriété supplémentaire utilisée pour spécifier sur quel lecteur la session est lancée. Triton Digital peut établir une liste non exhaustive de tous les lecteurs disponibles, mais les clients peuvent compléter cette liste selon leurs besoins.

Paramètres de requête

Toutes les autres chaînes de paramètres URI Query peuvent être fournies en vue d'une éventuelle utilisation future. Il peut par exemple s'agir d'identifiants utilisés pour faire correspondre les épisodes et podcasts.

X-Forwarded-For

Utilisé pour identifier l'adresse IP d'origine d'un client qui se connecte à un serveur Web via un proxy HTTP ou un répartiteur de charge.

Personnalisation/autres

Tout autre paramètre envoyé sera ignoré par nos systèmes.