Méthodologie de classification contextuelle

Précédent Suivant

Vue d’ensemble

Le modèle de classification contextuelle des catégories de Sounder identifie les sujets de conversation au niveau des segments des épisodes de podcast conformément à la taxonomie du contenu de l’IAB (3.0).

Méthodologie

Classification contextuelle

Les épisodes de podcast sont transcrits à l’aide du moteur de reconnaissance vocale automatique (ASR) exclusif de Sounder. En utilisant le traitement du langage naturel (NLP), nous analysons davantage les transcriptions pour identifier les entités nommées, les sujets, les sentiments et le ton, entre autres identifiants, qui prennent en charge l’identification contextuelle des catégories.

À titre d’exemple, si l’épisode traité le plus récent d’une émission date du 15 avril, tous les épisodes publiés et traités entre le 15 janvier et le 14 avril seront compris dans le calcul du score au niveau de l’émission.

interface-utilisateur-affiche-les-catégories-de-niveau

Résultats de la catégorie contextuelle

Toutes les catégories contextuelles sont classées de façon exhaustive au niveau du segment, puis additionnées dans la même fenêtre de 90 jours et cumulées au niveau de l’affichage.

Interprétation des scores de confiance des catégories contextuelles

Sounder identifie les catégories contextuelles de contenu de podcast au niveau des segments, résumant finalement les classifications au niveau des épisodes et des émissions. Pour qu’une catégorie soit définie au niveau de l’épisode, un seul épisode de podcast doit contenir au moins trois segments de la même catégorie.

La concentration et la profondeur des conversations des catégories identifiées déterminent les scores de confiance. Par exemple, une discussion d’environ 6 à 8 minutes portant sur un seul sujet donne probablement lieu à un score de confiance de 100 % pour la catégorie contextuelle associée. En revanche, une conversation sur le même sujet qui ne dure que quelques minutes ou moins n’aboutira probablement qu’à un score de confiance de 60 % ou moins.

Étant donné que les modèles de Sounder ne sont pas basés sur des mots-clés et s’appuient sur des signaux contextuels tels que le sentiment et le ton, le nombre précis d’identifiants ne garantit pas les résultats du score de confiance.