Exigences relatives aux journaux de podcast

Précédent Suivant

Livraison et fréquence des fichiers journaux

Les fichiers journaux sont extraits par Triton Digital depuis le S3, FTP ou SFTP (point de collecte) du client. Les éditeurs doivent fournir des identifiants nécessaires afin d'obtenir les fichiers journaux.

Les fichiers journaux doivent atteindre le point de collecte au moins une fois par jour, mais ils peuvent être plus fréquents, surtout si les fichiers sont plus gros et en plusieurs morceaux.  Triton Digital s'attend à recevoir les informations de la session dans les trois jours suivant le début de la session. Si le journal de session est reçu après ce délai, il ne sera pas pris en compte dans les mesures agrégées.

Nom du fichier

Les fichiers journaux doivent porter un nom unique, la date faisant partie du nom du fichier. Chaque fichier nommé doit arriver au point de collecte lorsque le journal est terminé (plutôt que l'ouverture du FTP dans le dossier de journalisation où les fichiers sont en cours d'écriture active). Chaque nom de fichier unique sera récupéré/traité une seule fois. Un exemple d'un nom de fichier approprié à cette fin est : MSLT20150830-00.tsv.gz, où 20150830 est la date, et -00 est un suffixe, si nécessaire, pour l'heure, le numéro de fichier de cette date, ou une autre valeur de séquençage/d'identification unique.

Pour des raisons d'efficacité, chaque fichier journal doit être compressé dans une archive à fichier unique « .gz ».

Persistence

Créer une tâche de nettoyage pour supprimer les fichiers de connexion qui ont été créés il y a plus de 60 jours. Par exemple, si vous utilisez le stockage Amazon S3, vous pouvez ajouter une règle de cycle de vie à votre espace de stockage mémoire pour ce faire.

Format du fichier

Les fichiers journaux doivent être dans l'un des formats suivants :

  • Format de sortie standard du serveur du fichier.  La sortie par défaut du journal d'accès de la plupart des services de streaming audio actuels est souvent utilisable, et ce, sans modification de la configuration.

  • Format selon le format de journaux étendu W3C (https://www.w3.org/TR/WD-logfile-960221.html). Ce format est couramment utilisé pour la sortie du serveur de streaming. Il s'agit essentiellement d'un fichier délimité par des tabulations ou des espaces avec un en-tête qui identifie les noms des champs pour chaque colonne des données.

  • Format sous la forme de valeurs séparées par des tabulations (tsv). Détails : Caractère de tabulation (comme \t ou 0x09). Fin de ligne (\n ou 0x0A). Le caractère de la ligne commentée. La ligne d'en-tête est idéale mais facultative. Si ce format est utilisé, veuillez contacter votre gestionnaire de compte Triton Digital et lui fournir les informations concernant le format/les champs de sortie prévus afin que nous puissions nous assurer de la bonne correspondance à un schéma d'analyse de fichiers journaux.

  • Pour ceux qui utilisent le CDN Akamai, ce format de fichier Luna doit être utilisé :
    Format de fichier Extended + Completion Flag Log :
    date_YYYY-MM-DD \t time_HH:MM:SS \t client_ip \t http_method \t arl_stem \t status_code \t total_bytes \t transfer_time \t "referrer" \t "user_agent" \t "cookie" \t total_object_size \t byte_range \t last_byte_served_flag

Champs obligatoires et facultatifs des lignes de journaux

In cases where the same value might be provided by more than one field, Triton uses only the first value in a log entry in the order presented. For example, if a log entry contains both dev et devicename, Triton uses dev and ignores devicename.

Required Fields

Logs must provide these fields.

Champ

Description

IP

Adresse IP publique distante de l'appareil du client. Cela peut être soit IPv4 soit IPv6. Il peut s'agir de l'adresse IP complète (par exemple, 200.150.100.111) ou d'une adresse IP partielle (tronquée) avec 0 comme dernier chiffre (par exemple, 200.150.100.0). S'il s'agit d'une adresse partielle, nous devons également recevoir l'adresse IP hachée dans un champ supplémentaire. L'adresse IP hachée est nécessaire pour maintenir un nombre correct de téléchargements et de valeurs uniques.

Hashed-IP

Hachage de l'adresse IP avec n'importe quel algorithme standard de fonction de hachage (par ex., MD5). La méthode de hachage doit réduire le risque de conflit et ne doit pas être communiquée. L'adresse IP hachée est utilisée pour dénombrer correctement les téléchargements uniques et les auditeurs uniques lorsque l'adresse IP est tronquée. (Voir le champ IP.)

user-agent

Contenu de l'en-tête HTTP « agent d'utilisateur ». Cet en-tête HTTP d'agent utilisateur contient une chaîne de caractères qui permet aux pairs du protocole réseau d'identifier le type d'application, le système d'exploitation, le fournisseur de logiciel ou la version du logiciel de l'agent utilisateur du logiciel demandeur.

Exemple : Mozilla/5.0 (Windows NT 10.0 ; Win64 ; x64)

date

Date à laquelle la transaction est conclue. Le format est AAAA-MM-JJ.

start-time

Horodatage du début de la session. Le format est HH :MM:SS

method

Ex. de méthode HTTP : GET

status

Ex. de code d'état HTTP : 200

url

URI (ou URL) complet allant jusqu'à 2048 caractères. Cette valeur doit être renseignée avec un point de publication unique (URI), de façon à ce que l'enregistrement puisse être appliqué à cette station dans notre système. En d'autres termes, une partie de ce champ sera utilisée comme clé de correspondance avec une station de la base de données de Triton Digital.

Exemple : /FolderABC/2018/02/20180209_pine0823.mp3?siteplayer=true&episode=588472

bytes

Octets transférés ou taille de réponse, du serveur au client. Ex. : 766967

object-size

Taille totale du fichier de podcast à télécharger.

byte-range

Des données devraient être disponibles si le code de réponse est 206. Ex. : 2008-19568

Optional Fields

Optional fields can be standalone or in some cases they can be positioned in the URI original query parameters.

Champ

Description

referrer

Adresse de la page Web précédente à partir de laquelle un lien vers la page actuellement demandée a été suivi.

time-taken

Numérique, jusqu'à neuf chiffres. Ceci est la durée de la session d'écoute, en secondes entières.

episode-guid

Identifiant GUID de l'épisode, tel qu'indiqué dans le flux RSS. Si cette valeur est présente, elle peut substituer l'URI comme clé de correspondance avec un épisode dans le flux RSS.

podcast-id

Identifiant du podcast (émission) où l'auditeur a commencé une session d'écoute.

vid

Identifiant d'enregistrement/de visiteur unique qui peut être utilisé pour identifier un auditeur et qui doit provenir du mécanisme d'enregistrement de l'auditeur.

lsid

Le LSID Triton Digital (autrement dit, l'UUID). Il s'agit de l'identifiant de l'application/cookie/publicité tel qu'il est présenté dans la rubrique Gestion de l'identifiant de l'auditeur de la spécification technique de la publicité. En règle générale, sur un appareil mobile, il doit s'agir d'un « GAID » de Google ou d'un « IDFA » d'Apple, ou s'il n'est pas disponible, d'un identifiant généré par l'application. Sur les ordinateurs de bureau, il doit s'agir d'un identifiant de cookie.

gender

Sexe d'un auditeur (M, F ou U). U peut être utilisé pour « autre » ou sexe « inconnu ».

yob

Listener’s year of birth, using the YYYY format.

age

Âge de l'auditeur.

zip

Code postal de l'auditeur (code à 5 chiffres ou code alphanumérique sans espace).

hasads

Indication signalant si la session d'écoute peut recevoir de la publicité. Possible values are 0 and 1. Sending 0 indicates that the session cannot receive advertising.

dev, devicename

Propriété supplémentaire utilisée pour spécifier sur quel périphérique la session est lancée. Triton Digital peut établir une liste non exhaustive des dispositifs disponibles, mais les clients peuvent compléter cette liste selon leurs propres besoins.

dist

Propriété supplémentaire qui peut être utilisée pour générer un regroupement indiquant sur quel distributeur/partenaire la session a été lancée. Par exemple, l'éditeur A partage son flux sur le distributeur/partenaire B, donc la propriété Distributeur est « B ». Triton Digital peut fournir une liste non exhaustive des distributeurs disponibles, mais les clients peuvent compléter cette liste selon leurs propres besoins.

src, ss, pversion, ou  terminalid

Propriété supplémentaire qui peut être utilisée pour générer un regroupement indiquant l'éditeur du flux. For example, Publisher A shares their stream on Partner B, so this property is "A". Cette méthode est rarement utilisée, car les journaux sont généralement produits par l'éditeur.

tgt, ps, pname, ou  plr

Propriété supplémentaire utilisée pour spécifier sur quel lecteur la session est lancée. Triton Digital peut établir une liste non exhaustive de tous les lecteurs disponibles, mais les clients peuvent compléter cette liste selon leurs besoins.

Query Params

Toutes les autres chaînes de paramètres URI Query peuvent être fournies en vue d'une éventuelle utilisation future. Il peut par exemple s'agir d'identifiants utilisés pour faire correspondre les épisodes et podcasts.

X-Forwarded-For

Utilisé pour identifier l'adresse IP d'origine d'un client qui se connecte à un serveur Web via un proxy HTTP ou un répartiteur de charge.

Other fields

Tout autre paramètre envoyé sera ignoré par nos systèmes.