Portrait-Robot de EventRegistry, maison mère de NEWSAPI.AI, dataset for AI & media monitoring
Tous les jours, des centaines de crawlers collectent des données sur les sites des éditeurs radio, TV, presse online & print. Ils opèrent pour les activités de veille, des analyses, des résumés, fournissent le big data de qualité indispensable aux IA …
Portrait-Robot de NewsAPI.AI et EventRegistry.org (dataset for AI, media monitoring)
Forbes nous présente EventRegistry comme « un service de surveillance mondiale des médias en temps réel, grâce à des algorithmes de recherche multilingues et une extraction approfondie d’informations afin de transformer les données en une plateforme décisionnelle significative ».
Vous cherchez des bases d’articles de presse de qualité? Ne cherchez plus:
“ Get articles from 150,000 news publishers worldwide”
“ Get the full news content as well as information about the mentioned entities, topics and sentiment.”
“Discover news content minutes after it is published”
“Archives since 2014”
“World’s leading companies are using NewsApi.ai”
Clients:
Spotify, IBM, Palantir, Bloomberg, Merck, Accenture, BASF, Johnson&Johnson, Airbus, Barclays, Disney, PWC, arabesque, OECD, BASF, McKinsey, Gouvernement Slovenie…
Eventregistery a obtenu des financements de la part du fonds Google’s Digital News Initiative.
Le Réseau académique et de recherche de Slovénie, Arnes, propose une présentation d’EventRegistry
1. obéir à robots.txt : EventRegistry utilisait un user agent explicite. Les quelques éditeurs qui le bloquaient ont peut-être eu raison de cet affichage ? Désormais, le user agent n’apparait plus, mais le trafic n’a pas baissé, au contraire. Ces ips ne passent de toutes façons pas sur robots.txt.
2. Stats sur Botscorner.
Les stats d’EventRegistry, dont le service a été lancé en 2017, montrent une activité conséquente sur les sites équipés de Botscorner.
3. Tarifs