Le
NewsML™ chez InstantRP
NewsML
(1)
est une
spécification de l'IPTC (International Press and
Telecommunications Council) en matière de transmission
et d'échange d'informations et d'actualités. NewsML
génère des informations qui
accompagnent le communiqué de presse, les images ou
le document multimédia.
Ces
informations renseignent sur l'auteur, les formats, les
droits de diffusion, le contenu et le public
cible . Elles sont utilisées par les systèmes de
diffusion et d'archivage des rédactions
et les éditeurs de contenu.
Cette
indexation est indépendante de la langue
de rédaction du communiqué, elle est donc
universelle.
Grâce à
NewsML le journaliste disposera des
métadonnées dans sa langue,
compatibles avec tous les canaux de réception
(messageries universelle, télécopie électronique,
courrier, web, XML, Mobile, ...) et les outils de
mises en pages des rédactions de la presse écrite ou
audiovisuelle.
(Voir
exemples plus bas).
Cette
indexation est effectuée par nos services
spécialisés à partir de la langue d'origine du
communiqué - anglais, espagnol, français, allemand,
néerlandais, portugais, italien, polonais, chinois,
japonais, russe et arabe - des champs normalisées et un
vocabulaire contrôlé facilitent le travail
d'indexation, de diffusion et d'archivage par les médias
et sa rediffusion auprès des abonnés des agences de
presse spécialisées ou des
provider de contenu.
Des
champs spécifiques permettent de "signer"
le contenu du communiqué. A
l'international, cette signature est imposée par les éditeurs
et les agences car elle garantie au(x) diffuseur(s) l'identité de
la source du communiqué et la gestion des droits de
copyright éventuels - photos, vidéo, rapports, sondages, études,
extraits de parution, ...
Fig. 2
Démo
traitement de
fil d'agence
par un journaliste sur son terminal
:
Le
besoin d'indexation normalisée des News et des
communiqués (textes, images, multimédias) a été
rendu indispensable par la croissance continue de la
production, par l'utilisation et de la réutilisation
des communiqués de presse par des médias du monde
entier.
Ce besoin a été accentué par l'expansion rapide, depuis le milieu
des années 80, de l'Internet et des réseaux privés de
diffusion (intranet d'entreprises,
d'administrations, services de veille, fils de
presse électroniques, flux satellitaires, GSM-Mobile,
...).
Bref concept de
l'indexation NewsML utilisé par InstantRP
Au cœur
du concept d'indexation d'InstantRP construit sur NewsML réside dans le fait qu'un communiqué de
presse contient de nombreuses informations (Qui,
Quoi, Où, Comment, Marque, Lieu, Personnalité, ...)
et faire référence à différents
supports liés ou joints au communiqué
- texte, photos, graphiques, vidéo - il doit donc contenir toutes les méta-informations (auteur,
date, langue, ... voir
Dublin Core)
qui permettent au destinataire :
-
d'effectuer des recherches dans le système
d'information du médias dans lesquels sera stocké
après diffusion le communiqué,
- de comprendre
et d'appréhender rapidement le
rapport entre les composants et de comprendre le
rôles de chaque composant.
Tout les
journalistes ou éditeurs destinataires de votre
communiqué doivent pouvoir connaître la teneur
des informations fournies. Cette connaissance est
également indispensable pour la rediffusion ou
l'archivage.
Ainsi
l'indexation News ML effectuée par InstantRP permet à
des éditeurs, des journalistes, des médias de
fournir le même texte dans différentes langues,
différentes résolutions de la même photographie,
différents supports sans perte d'information sur la
source et le contenu.
Fig. 2
: Concept d'intégration de métadonnées dans un
communiqué de presse
(Ces
métadonnées symbolisées sont uniquement
déchiffrables par les médias.)

Exemples de métadonnées
administratives
Date
création, auteur, origine, niveau d'actualité
(urgence) source (crédit) dimension (image) ou
nombre de mots/signes.
Fig. 3
: Exemple d'intégration de métadonnées administratives dans une image associée à un
communiqué de presse
(Les
métadonnées symbolisées par le cube jaune, sont
uniquement déchiffrables par les médias.)

Fig. 4:
Exemple d'utilisation de métadonnées administratives dans une image associée à un
communiqué de presse dans une rédaction.

Description du contenu et du public cible :
DescriptiveMetadata
La
richesse de l'information véhiculée dans les
métadonnées utilisées par InstantRP facilitera le
travail des journalistes et des éditeurs : niveaux
de révision pour faciliter le suivi d'un
communiqué dans le temps, statut détaillé
(publiable, mise sous embargo jusqu'au ..., etc.), les détails administratifs, tels que le nom de
l'auteur, de l'entreprise, du service de
l'entreprise, du contact presse ou les détails de
copyright).
News ML disposent de vocabulaires de métadonnées universels
automatiquement traduit dans la langue du système
d'information du destinataire, des codes
matière (News, Salon, Nouveau produit, ...), des
codes pays etc.) - pour le contenu du
texte, des mots clés seront créés automatiquement ou
introduit par le signataire.
Fonction indexation du sujet : Rubrique /
sous-rubrique(s) journalistique
Pour les évènements
sportifs l'indexation garantie une parfaite
distribution entre les membres d'une même rédaction
et les rediffusions : agence de presse, web, mobile,
...
Exemple
d'indexation
d'événement sportif : sports-metadata
|
date-time = 2005 05 12
Time 16:30
Language = en-US
sports-title = Boxscore:
St. Louis
vs. Los Angeles
code-name = The Sports
Network
code-key =
sportsnetwork.com
code-type = publisher
code-type = sport
code-key = 15007000
|
code-name= Baseball
code-type = league
code-key = l.mlb.com
code-name = Major
League
Baseball
code-type = season-type
code-key= regular
code-type = season
code-key = 2005
code-type = priority
|
code-key = normal
code-type = conference
code-key = c.national
code-name = National
code-type = team
code-name = St. Louis
Cardinals
code-type = team
code-name = Los
Angeles Dodgers
|
Exemples d'indexation de contenu multicanaux
|
|
Subject
|
SubjectMatter
|
SubjectDetail
|
|
13000000
|
13xxxxxx
|
13000xxx
|
13000000
|
|
|
Science and technology
|
(none)
|
(none)
|
SubjectMatter
|
|
Subject
|
SubjectMatter
|
SubjectDetail
|
|
07002000
|
07xxxxxx
|
17002xxx
|
17002000
|
|
|
(health)
|
epidemic and plague
|
(none)
|
SubjectDetail
|
|
Subject
|
SubjectMatter
|
SubjectDetail
|
|
04015002
|
04xxxxxx
|
04015xxx
|
04015002
|
|
|
(economy, business
and finance)
|
(transport)
|
Railway
|
SubjectQualifier
|
|
Subject
|
SubjectMatter
|
SubjectQualifier
|
|
15000001
|
15xxxxxx
|
15000xxx
|
15000001
|
|
|
(sport)
|
(none)
|
Men
|
|
 |
Fonction indexation par type de destinataire :
lectorat, auditeurs, téléspectateurs
Les métadonnées descriptives sont
employées pour décrire la teneur d'un communiqué de
presse avec des indications spécifiques pour
la langue, le genre (la nature de l'information,
comme : information courante, analyse, prévision,
entrevue, rétrospectifs, compte rendu, ) ;
OfInterestTo vers quel type de
lectorat ou de public cible est destiné le
communiqué : parent, enfants, ados,
professionnels, spécialisés, ...) et TopicOccurence.
Fonction
Embargo
L'indexation facilite et automatise le classement
des informations par les journalistes, ainsi un
communiqué réceptionné le 19 septembre sera annoté
pour figurer dans les articles publié lors de la
rentrée scolaire et se trouvera repris dans de
nombreuses publications entre le 15 et le 20 octobre.
Les
journalistes des grands médias reçoivent,
quotidiennement, 40 à 80
dépêches d'agences ou communiqués,
l'indexation à des fins de classement et d'archivage
pour usages ultérieures est déterminante.
L'embargo jusqu'au ...
peut-être également introduit
pas l'émetteur du communiqué pour indiquer à la
presse de mettre sous embargo cette information
jusqu'à la date indiquée.
Fig. 3 Schéma indexation Embargo de MLNews utilisé
par les médias

Fig. 4
: Exemple d'article de presse (presse écrite
quotidienne et online) résultant de l'envoi d'un
communiqué
un mois avant
la parution dans un quotidien
et. mis sous embargo jusqu'à la date de parution
choisie.
Plusieurs quotidiens ont repris ce communiqué durant
la période médiatique rentrée scolaire .

(1) : NewsML™ est une marque déposée de l'IPTC
IPTC 7961 et NewsML™ : les formats de
transmissions indexées des communiqués de presse
Prolongeant l'indexation normalisée du
Dublin Core
l'IPTC
a formulé sa recommandation
7961 destinée à standardiser la transmission des
messages textuels destinées aux journaux, aux
agences de presse et à d'autres médias (presse web
presse audiovisuelle, ...).
La première version est
apparue dans les années 86, elle fût utilisée en
partie par InstantRP et ses partenaires dés 1988
puis remplacée en 2002 par la norme NewsML™ .
Cette
recommandation a été influencée par le «Highspeed
Wire Service Transmission Guidelines» du Newspaper Association of America (NAA), nouvelle
dénomination de l'American
Newspaper Publishers Association (ANPA).
Prévu
pour la diffusion à l'international nos indexations
tiennent compte des différences techniques des
canaux de diffusion et des différences linguistiques
entre les pays.
Cette
indexation est conçue pour être compatible avec de
nombreuses langues et les différents alphabets. Pour
disposer d'un degré de flexibilité et pour réduire
au minimum l'influence de changements des pratiques
plus tôt, quelques éléments d'indexation ont été
conçus comme « facultatif » ou « recommandés ».
Afin
d'être compatibles avec toutes les langues et les
alphabets, la recommandation est transparente aux
codes de diffusions : jeu de caractères codé 7
par bits d'OIN 646 (alphabet NR de CCITT. 5); jeux
de caractères alternatifs (bit 7 et 8), y compris
les alphabets non-Latins langues asiatiques,
d'Europe de l'Est, Arabe, persan, ...
NewsML
 |
NewsML est une spécification de l' IPTC
(International Press and Telecommunications
Council) pour la transmission et l'échange des
informations d'actualités. La version 1.0 a été ratifiée en Octobre 2000,
la version 1.1 en Octobre 2002, et la version
1.2 actuelle en Octobre 2003 |
 |
NewsML est d'ores et déjà utilisé (et le
sera de plus en plus) par les agences de presse
( AFP ,
Reuters )
pour la transmission des dépêches et
l'automatisation des fils d'agences. NewsML
est conçu pour l'échange des textes, graphiques,
photos, séquences audio, video et animations.
|
 |
Bien
qu'il existe certains chevauchements entre PRISM et la partie de
NewsML qui
traite des métadonnées, les deux spécifications
sont largement indépendantes et complémentaires.
Ainsi, à la différence de PRISM, la
partie de NewsML concernant les
métadonnées ne s'appuie pas sur RDF.
Le
vocabulaire PRISM a été défini de telle
façon qu'il puisse être utilisé dans la partie
de NewsML traitant des métadonnées qui
comprend trois catégories majeures:
-
AdministrativeMetadata
-
RightsMetadata
-
DescriptiveMetadata
|
NewsML
permet d'étendre le jeu
des métadonnées prédéfinies ainsi que l'utilisation
de vocabulaires contrôlés pour spécifier certaines
métadonnées.
À cette fin, NewsML préconise l'utilisation
de l' IPTC Subject Reference System pour décrire les
informations échangées.
Exemples XML
D'autres langages spécialisés sont
en cours de définition également sous l'égide de l'
IPTC :
- SportsML pour l'échange des
résultats sportifs.
- ProgramGuideML , pour l'échange
des programmes de télévision et radio
- EventsML, pour l'échange
d'information sur les évènements et manifestations
(Salons, conférence de presse, ...)