La recherche sur l'argumentation dans les audiences de la CEDH.
La recherche sur l'argumentation dans les audiences de la CEDH.
La recherche sur l'argumentation dans les audiences de la CEDH.
3 minutes
3 minutes
20 févr. 2025
20 févr. 2025


Des chercheurs ont mis au point un corpus pour l'étude de l'argumentation juridique : LaCour!
Dans un article précédent, je vous parlais de l'importance des ensembles de données juridiques de qualité pour l'avancement de l'IA dans le domaine du droit. Je mentionnais également le manque de jeux de données francophones suffisamment volumineux pour entraîner des modèles de pointe, ce qui constitue un véritable défi pour les legaltechs francophones.
Une étude récente a présenté LaCour!, le premier corpus de transcriptions d'audiences orales de la Cour européenne des droits de l'homme (CEDH). Jusqu'à présent, la recherche juridique empirique et le TAL appliqué au droit ne pouvaient se baser que sur les jugements finaux, sans accès aux débats oraux préliminaires qui ont pu influencer les décisions.
Des chercheurs ont collecté 154 audiences publiques de la CEDH entre 2012 et 2021, représentant 267 heures de vidéos. Ils ont développé un pipeline de traitement automatique combinant reconnaissance vocale, diarisation des locuteurs, annotation manuelle des rôles et langues, et alignement avec les jugements correspondants. Avec forcement un effort de correction manuelle.
Le corpus LaCour! contient 2,1 millions de mots transcrits, étiquetés par rôle (juge, requérant, gouvernement, etc.), langue, et liés aux documents de jugement finaux. Les statistiques montrent un bon équilibre entre les parties dans la plupart des audiences.
Une analyse suggère un lien entre les questions posées par les juges lors des audiences et leurs opinions dissidentes ou concordantes dans les jugements. Des expériences de similarité textuelle entre questions et opinions n'ont pas encore permis de bien classifier le type d'opinion à partir du texte de la question.
LaCour! permet d'étudier pour la première fois l'interaction entre les débats oraux et les jugements finaux à la CEDH. Au-delà des applications en TAL juridique, ça présente un intérêt pour la formation juridique.
Heureux de voir que des chercheurs européens se saisissent de ces questions, même si d’autres recherches seront nécessaires pour mieux caractériser les liens entre argumentation orale et décisions de justice.
Envie d’explorer concrètement ce sujet ? Testez Haiku gratuitement pendant 30 jours et découvrez comment notre application peut vous aider. 👉 Testez Haiku gratuitement
Source : https://arxiv.org/pdf/2312.05061.pdf
Des chercheurs ont mis au point un corpus pour l'étude de l'argumentation juridique : LaCour!
Dans un article précédent, je vous parlais de l'importance des ensembles de données juridiques de qualité pour l'avancement de l'IA dans le domaine du droit. Je mentionnais également le manque de jeux de données francophones suffisamment volumineux pour entraîner des modèles de pointe, ce qui constitue un véritable défi pour les legaltechs francophones.
Une étude récente a présenté LaCour!, le premier corpus de transcriptions d'audiences orales de la Cour européenne des droits de l'homme (CEDH). Jusqu'à présent, la recherche juridique empirique et le TAL appliqué au droit ne pouvaient se baser que sur les jugements finaux, sans accès aux débats oraux préliminaires qui ont pu influencer les décisions.
Des chercheurs ont collecté 154 audiences publiques de la CEDH entre 2012 et 2021, représentant 267 heures de vidéos. Ils ont développé un pipeline de traitement automatique combinant reconnaissance vocale, diarisation des locuteurs, annotation manuelle des rôles et langues, et alignement avec les jugements correspondants. Avec forcement un effort de correction manuelle.
Le corpus LaCour! contient 2,1 millions de mots transcrits, étiquetés par rôle (juge, requérant, gouvernement, etc.), langue, et liés aux documents de jugement finaux. Les statistiques montrent un bon équilibre entre les parties dans la plupart des audiences.
Une analyse suggère un lien entre les questions posées par les juges lors des audiences et leurs opinions dissidentes ou concordantes dans les jugements. Des expériences de similarité textuelle entre questions et opinions n'ont pas encore permis de bien classifier le type d'opinion à partir du texte de la question.
LaCour! permet d'étudier pour la première fois l'interaction entre les débats oraux et les jugements finaux à la CEDH. Au-delà des applications en TAL juridique, ça présente un intérêt pour la formation juridique.
Heureux de voir que des chercheurs européens se saisissent de ces questions, même si d’autres recherches seront nécessaires pour mieux caractériser les liens entre argumentation orale et décisions de justice.
Envie d’explorer concrètement ce sujet ? Testez Haiku gratuitement pendant 30 jours et découvrez comment notre application peut vous aider. 👉 Testez Haiku gratuitement
Source : https://arxiv.org/pdf/2312.05061.pdf
Des chercheurs ont mis au point un corpus pour l'étude de l'argumentation juridique : LaCour!
Dans un article précédent, je vous parlais de l'importance des ensembles de données juridiques de qualité pour l'avancement de l'IA dans le domaine du droit. Je mentionnais également le manque de jeux de données francophones suffisamment volumineux pour entraîner des modèles de pointe, ce qui constitue un véritable défi pour les legaltechs francophones.
Une étude récente a présenté LaCour!, le premier corpus de transcriptions d'audiences orales de la Cour européenne des droits de l'homme (CEDH). Jusqu'à présent, la recherche juridique empirique et le TAL appliqué au droit ne pouvaient se baser que sur les jugements finaux, sans accès aux débats oraux préliminaires qui ont pu influencer les décisions.
Des chercheurs ont collecté 154 audiences publiques de la CEDH entre 2012 et 2021, représentant 267 heures de vidéos. Ils ont développé un pipeline de traitement automatique combinant reconnaissance vocale, diarisation des locuteurs, annotation manuelle des rôles et langues, et alignement avec les jugements correspondants. Avec forcement un effort de correction manuelle.
Le corpus LaCour! contient 2,1 millions de mots transcrits, étiquetés par rôle (juge, requérant, gouvernement, etc.), langue, et liés aux documents de jugement finaux. Les statistiques montrent un bon équilibre entre les parties dans la plupart des audiences.
Une analyse suggère un lien entre les questions posées par les juges lors des audiences et leurs opinions dissidentes ou concordantes dans les jugements. Des expériences de similarité textuelle entre questions et opinions n'ont pas encore permis de bien classifier le type d'opinion à partir du texte de la question.
LaCour! permet d'étudier pour la première fois l'interaction entre les débats oraux et les jugements finaux à la CEDH. Au-delà des applications en TAL juridique, ça présente un intérêt pour la formation juridique.
Heureux de voir que des chercheurs européens se saisissent de ces questions, même si d’autres recherches seront nécessaires pour mieux caractériser les liens entre argumentation orale et décisions de justice.
Envie d’explorer concrètement ce sujet ? Testez Haiku gratuitement pendant 30 jours et découvrez comment notre application peut vous aider. 👉 Testez Haiku gratuitement
Source : https://arxiv.org/pdf/2312.05061.pdf