ISPAwards 2024– Internet Student Paper Award

ISPAwards 2024– Internet Student Paper Award

 

Avez-vous rédigé un thèse de premier ou de deuxième cycle sur un sujet lié à l’internet au cours de cette année universitaire ? Est-ce encore frais dans votre esprit?

Alors sortez à nouveau votre stylo et concourez pour le sixième ISPAwards!

Qu’est-ce que c’est?

Comme tous les ans, ce prix est attribué par ISPA, l’association représentant l’industrie belge de l’Internet. Saisissez votre chance de remettre votre carte visite au secteur et qui sait, vous repartirez peut-être avec 500 €.

Comment puis-je participer?

Envoyez un article de 2 500 mots maximum, en anglais, français ou néerlandais, basé sur votre thèse à secretariat@ispa.be . Le sujet du document doit être lié à la modération de contenu, à la protection des données, à la vie privée, les technologies émergentes ou tout autre sujet lié à l’internet.

D’accord, mais quand ?

La date limite est le vendredi 20 octobre 2023. Le lauréat sera annoncé au début de l’année 2024.

Mais qu’est-ce que c’est exactement « ISPA » ?

ISPA Belgium rassemble l’ensemble de l’écosystème de l’industrie de l’internet en Belgique et comprend les entreprises qui font fonctionner l’internet, comme les fournisseurs d’accès, les hébergeurs, les fournisseurs de transit, les centres de données et les plateformes. L’association veille à ce que la voix de la communauté de l’internet soit entendue et comprise par les décideurs politiques et le grand public, afin de permettre la création de politiques favorables au numérique, orientées vers l’avenir et cohérentes en Belgique.

ISPAwards 2023 – abstract of the winning paper

ISPAwards 2023 – abstract of the winning paper

Dishani Sen receives her ISPAward from Henri-Jean Pollet, president of ISPA Belgium. 

Using Digital Trace Data to Generate Representative Estimates on Disease Prevalence (COVID-19 Infections) in Belgian Municipalities

Is it possible to predict the area-level prevalence of COVID-19 infections in Belgium by analyzing
self-reported symptoms on Twitter? Relying solely on hospital and clinic-focused studies has its limitations,
so researchers have been exploring the potential of digital trace data to gain a better understanding of
the prevalence of COVID-19 and the symptoms experienced by infected individuals.

There’s an optimistic future in the possibility that monitoring social media data is a viable strategy for
public health surveillance. It is a critical competency that public health organizations are investing in in
order to receive real-time signals of pandemic upticks and spread. However, social media data is often
unorganized, and a non-representative sample of the population due to demographic skew in usage
frequencies and access rates. As such, any direct estimate from a platform like Twitter is likely biased
toward certain demographics. With this in mind, an attempt is made to use tweets (digital trace data) to
make inferences about the granular level prevalence of COVID-19 infections in Belgium.

This research is about generating estimates of the incidence of COVID-19 infections, at the municipality level,
by using Multilevel Regression Post-Stratification (MrP) to account for sampling biases in the social media
sample. At first, tweets are obtained from users based on keywords derived from previous research, e.g.,
tweets mentioning fever, cough, loss of taste, fatigue, etc. Then, key demographic and geographical
features of interest are extracted using the M3 deep learning pipeline, as well as simple self-reported
characteristics, effectively transforming the unstructured twitter sample into a survey-like object. Finally,
based on these demographic features and census characteristics, a mixed effects logistic regression model
with post-stratification according to the Belgian census is proposed to forecast the number of infected
individuals on a particular day. This study contributes to the proof of concept of a complete end to end
pipeline to perform real time predictions of disease prevalence at a granular level in a population using
social media data. Through this POC, contributions are made to three core elements: collecting
mass-scaled tweets, extracting demographic features and assigning a location value to convert
unstructured digital data to survey-like objects, and using a multi-level regression model with
post-stratification to make real-time predictions on the population using digital trace data.

The study’s overall hypothesis was that the area-level prevalence of COVID-19 at the municipal level can
be modeled using MrP on features extracted from aggregated tweets to generate representative estimates.
The results of the study are similar to actual data on the prevalence of COVID-19 infections in Belgium
for a reference period by a correlation of 93%. This strong positive correlation is a very promising
indication that there is an enormous signal in the Twitter data and that, this methodology has high potential
in digital epidemiology.

ISPAwards 2023 – abstract of the winning paper

ISPAwards 2023 – abstract of the winning paper

Dishani Sen reçoit son ISPAward des mains d’Henri-Jean Pollet, président de l’ISPA Belgique.

Utilisation des données de traces numériques pour générer des estimations représentatives de la prévalence de la maladie (infections par COVID-19) dans les municipalités belges

Est-il possible de prédire la prévalence au niveau régional des infections par COVID-19 en Belgique en analysant les symptômes déclarés sur Twitter ?
l’analyse des symptômes déclarés sur Twitter ? S’appuyer uniquement sur des études centrées sur les hôpitaux et les cliniques a ses limites,
Les chercheurs ont donc exploré le potentiel des données numériques pour mieux comprendre la prévalence de COVID-19 en Belgique.
de la prévalence de COVID-19 et des symptômes ressentis par les personnes infectées.

La possibilité que le suivi des données des médias sociaux soit une stratégie viable pour la surveillance de la santé publique
est une perspective optimiste. surveillance de la santé publique. Il s’agit d’une compétence essentielle dans laquelle les organismes
de santé publique investissent afin de recevoir en temps réel des signaux de pandémie en temps réel sur l’évolution et la propagation de la pandémie.
Cependant, les données des médias sociaux sont souvent non organisées et constituent un échantillon non représentatif de la population en raison de
l’asymétrie démographique dans les fréquences d’utilisation et les taux d’accès. Ainsi, toute estimation directe à partir d’une plateforme comme Twitter
est susceptible d’être biaisée par rapport à certaines données démographiques. C’est dans cette optique que nous avons tenté d’utiliser les tweets (données numériques)
pour déduire la prévalence au niveau granulaire des infections par COVID-19 en Belgique.

Cette recherche vise à générer des estimations de l’incidence des infections par COVID-19, au niveau de la municipalité, en utilisant la post-stratification
de régression multiniveaux (MrP) pour tenir compte des biais d’échantillonnage dans l’échantillon des médias sociaux. Dans un premier temps,
les tweets sont obtenus auprès des utilisateurs sur la base de mots-clés dérivés de recherches antérieures, par exemple les tweets mentionnant la fièvre,
la toux, la perte de goût, la fatigue, etc. Ensuite, les principales caractéristiques démographiques et d’intérêt sont extraites à l’aide du pipeline d’apprentissage profond M3,
ainsi que des caractéristiques autodéclarées, transformant ainsi efficacement l’échantillon non structuré de tweets en un objet semblable à une enquête.

Enfin, sur la base de ces caractéristiques démographiques et de recensement, un modèle de régression logistique à effets mixtes avec post-stratification
selon le recensement belge est proposé pour prévoir le nombre de personnes infectées un jour donné. Cette étude contribue à la preuve de concept d’un pipeline
complet de bout en bout pour effectuer des prédictions en temps réel de la prévalence des maladies à un niveau granulaire dans une population
en utilisant les données des médias sociaux. Dans le cadre de ce POC, des contributions sont apportées à trois éléments fondamentaux: la collecte de tweets à grande échelle,
l’extraction de caractéristiques démographiques et l’attribution d’une valeur de localisation pour convertir des données numériques non structurées en objets de type enquête,
et l’utilisation d’un modèle de régression à plusieurs niveaux avec post-stratification pour faire des prédictions en temps réel sur la population à l’aide de données de traces numériques.

L’hypothèse générale de l’étude était que la prévalence de COVID-19 au niveau municipal peut être modélisée à l’aide de MrP sur les caractéristiques
de la population extraites de tweets agrégés afin de générer des estimations représentatives. Les résultats de l’étude sont similaires aux données réelles
sur la prévalence des infections par COVID-19 en Belgique pour une période de référence, avec une corrélation de 93 %. Cette forte corrélation positive est
une indication très très prometteuse qu’il y a un signal énorme dans les données de Twitter et que cette méthodologie a un potentiel élevé en épidémiologie numérique.

ISPAwards 2024– Internet Student Paper Award

PRIX DE LA THÈSE – ISPA présente l’Internet Student Paper Award

Avez-vous rédigé une thèse de premier ou de deuxième cycle concernant un sujet lié à l’Internet au cours de cette année universitaire ? Est-ce encore frais dans votre esprit ?

Alors sortez à nouveau votre stylo et concourez pour le ISPAward !

Qu’est-ce que c’est ?

Comme tous les ans, ce prix est attribué par ISPA, l’association représentant l’industrie belge de l’Internet. Saisissez votre chance de remettre votre carte visite au secteur et qui sait, vous repartirez peut-être avec 500 €.

Comment puis-je participer ?

Envoyez un document de 2 500 mots maximum, en français, néerlandais ou anglais, basé sur votre thèse ou votre mémoire à secretariat@ispa.be. Le document doit être lié à la modération du contenu, à la protection des données, à la vie privée ou aux technologies émergentes, ou tout autres sujets reliés au secteur de l’internet.

D’accord, mais quand ?

La date limite est le vendredi 20 octobre 2023.

Mais qu’est-ce que c’est exactement  « ISPA » ?

ISPA Belgium rassemble l’ensemble de l’écosystème de l’industrie de l’Internet en Belgique et comprend les entreprises qui font fonctionner l’Internet, comme les fournisseurs d’accès, les hébergeurs, les fournisseurs de transit, les centres de données et les plateformes.

L’association veille à ce que la voix de la communauté Internet soit entendue et comprise par les décideurs politiques et le grand public, afin de permettre la création de politiques favorables au numérique, tournées vers l’avenir, et cohérentes en Belgique.

Internet Student Paper Award – abstract of the winning paper

Internet Student Paper Award – abstract of the winning paper

Loni Riskin receives her ISPAward from Henri-Jean Pollet, president of ISPA Belgium.

 

Doping control and data protection might seem topics not that closely related to each other. However, the GDPR applies to a large part of the data processing taking place in the anti-doping process. A lot of sensitive data is being processed in the context of doping control. Yet, WADA’s World Anti-Doping Code (WADC), applied by more than 700 sport organizations, still falls short in terms of GDPR compatibility.

A legal analysis of the GDPR and WADC has shown several points of conflict. For example, the WADC defines different grounds based on which sensitive data can be processed, such as explicit consent. However, the GDPR requires that when information is processed based on explicit consent, this consent needs to be ‘freely given’. Yet, if an athlete does not want to provide their consent, the WADC prescribes harsh sanctions and negative consequences for the athlete. It is therefore hard to classify this consent as ‘freely given’, since athletes could feel obliged to give consent.

Furthermore, WADA requires the automatic and mandatory publication on the internet of all anti-doping violations, including the name of the athlete and the sanctions imposed, for a period of at least one month. This however does not seem to be conform the GDPR’s proportionality principle. WADA sees this publication as necessary for athletes to not take on another role in sport, but less intrusive measures such as a certificate of good conduct, which these athletes wouldn’t be able to provide, can fulfill this role.

These are just a few examples, but they show that a more far-reaching adaptation of the WADA documents to the GDPR remains desirable. However, even though they agree with some adjustments, interviews with athletes, coaches and sport federations have shown that they think it is good that some anti-doping rules are so intrusive, since it scares off other athletes to take doping. They fear that if the current measures are adjusted to be more GDPR-compliant, this will lower the threshold to doping violations and make doping controls more difficult. So while this research answered a lot of questions, the question still arises of how to find measures that are both more in line with the GDPR and considers the comments made by athletes and sports federations.