Academic Associate - Data Engineer

Updated: 9 months ago
Location: Sherbrooke East, QUEBEC
Job Type: FullTime
Deadline: The position may have been removed or expired!

Please refer to the How to Apply for a Job (for External Candidates)  job aid for instructions on how to apply.

If you are an active McGill employee (ie: currently in an active contract or position at McGill University), do not apply through this Career Site. Login to your McGill Workday account and apply to this posting using the Find Jobs report (type Find Jobs in the search bar).

A French position summary will follow:

Position Summary:

The Media Ecosystem Observatory at McGill University is seeking applications for a full-time Academic Associate position with expertise in data and software engineering. The candidate will be joining the Centre at a stimulating time of growth and expansion and will manage and help drive a growing research agenda.

The successful applicant will have:

  • facility with Python, SQL, and the Linux command line (bash)
  • experience with at least one traditional RDBMS database management (such as PostgreSQL, MySQL, MariaDB, or similar solutions)
  • experience with at least one message-queue (job-queue) system, such as Kafka, RabbitMQ, ActiveMQ, etc.
  • experience with cloud computing, including provisioning and running a server (AWS EC2 or equivalent)
  • experience with web scraping, particularly by automating browsers (Selenium or an equivalent solution)
  • willingness to learn and explore new technologies on the job
  • familiarity with version control (Git) and effective communication skills to develop code in tandem with others

The successful applicant may have:

  • experience with NoSQL or NewSQL databases, such as MongoDB, Cassandra, Druid, CockroachDB, etc.
  • experience with Docker, Kubernetes, and the process of containerizing code and using serverless architectures in the cloud, and/or familiarity with scheduling jobs in computing clusters using Slurm
  • experience working with social media data
  • have published in the area of misinformation, disinformation, and information ecosystem studies, and be familiar with the academic publishing process
  • familiarity with MLOps, or training ML classifiers
  • the ability to communicate effectively in French

Specific duties:

Under the Direction of the Media Ecosystem Observatory leadership, the successful candidate will be expected to fulfill the following duties:

  • Help design a data pipeline to ingest social and news media from the web, archive that data in an orderly and cost-effective manner, and render that data accessible (with minimal latency) to researchers.
  • Help write code to implement the pipeline. The code will be deployed in the cloud to scrape social and news media sites, insert the scraped data into a scalable backend database, and render the data accessible (with minimal latency) to researchers, facilitating research into misinformation, disinformation, and the information ecosystem in Canada and comparable countries around the world.

Contract Details

  • This position is a full-time contract position for one (1) year, with possibility of renewal. 

Salary

  • The salary will be commensurate with experience and education level.

Education

  • Post-secondary degree in computer science or commensurate experience.

The following supporting documents are required:

  • A cover letter
  • Curriculum vitae and/or Github profile
  • The names and contact information of two references

We thank all applicants for their interest, however, only applicants selected for an interview will be contacted.

Résumé du poste :

The Media Ecosystem Observatory de l'Université McGill sollicite des candidatures pour un poste d'associé académique à temps plein avec une expertise en ingénierie des données et des logiciels. Le candidat se joindra à l'Observatoire à un moment stimulant de croissance et d'expansion et gérera et aidera à diriger un programme de recherche en pleine expansion.

Le candidat retenu devra

- une facilité avec Python, SQL et la ligne de commande Linux (bash)

- une expérience d'au moins un système de gestion de base de données RDBMS traditionnel (tel que PostgreSQL, MySQL, MariaDB ou des solutions similaires)

- expérience avec au moins un système de file d'attente de messages (job-queue), tel que Kafka, RabbitMQ, ActiveMQ, etc.

- une expérience de l'informatique en nuage, notamment de l'approvisionnement et de l'exploitation d'un serveur (AWS EC2 ou équivalent)

- expérience en matière de scraping web, en particulier en automatisant les navigateurs (Selenium ou une solution équivalente)

- volonté d'apprendre et d'explorer de nouvelles technologies dans le cadre du travail

- une bonne connaissance du contrôle de version (Git) et des compétences de communication efficaces pour développer du code en tandem avec d'autres personnes.

Le candidat retenu peut avoir

- une expérience des bases de données NoSQL ou NewSQL, telles que MongoDB, Cassandra, Druid, CockroachDB, etc.

- une expérience avec Docker, Kubernetes et le processus de conteneurisation du code et l'utilisation d'architectures sans serveur dans le cloud, et/ou une familiarité avec l'ordonnancement des tâches dans les clusters de calcul à l'aide de Slurm.

- expérience de travail avec les données des médias sociaux

- avoir publié dans le domaine de la désinformation et des études sur l'écosystème de l'information, et être familiarisé avec le processus de publication universitaire

- être familiarisé avec les MLOps ou la formation de classificateurs ML

- capacité à communiquer efficacement en français

Fonctions spécifiques :

Sous la direction de l'Observatoire des écosystèmes médiatiques, le candidat retenu devra accomplir les tâches suivantes :

- Aider à concevoir un pipeline de données pour ingérer les médias sociaux et d'information à partir du web, archiver ces données d'une manière ordonnée et rentable, et rendre ces données accessibles (avec un temps de latence minimal) aux chercheurs.

- Aider à écrire le code pour mettre en œuvre le pipeline. Le code sera déployé dans le nuage pour analyser les sites de médias sociaux et d'information, insérer les données analysées dans une base de données évolutive et rendre les données accessibles (avec une latence minimale) aux chercheurs, facilitant ainsi la recherche sur la désinformation et l'écosystème de l'information au Canada et dans des pays comparables à travers le monde.

Détails du contrat

- Ce poste est un contrat à temps plein d'une durée d'un (1) an, avec possibilité de renouvellement.

Salaire

- Le salaire sera proportionnel à l'expérience et au niveau d'éducation.

Formation

- Diplôme postsecondaire en informatique ou expérience équivalente.

Les pièces justificatives suivantes sont requises :

- Une lettre de motivation

- Curriculum vitae et/ou profil Github

- Les noms et coordonnées de deux personnes de reference

Nous remercions tous les candidats de leur intérêt, mais seuls les candidats sélectionnés pour un entretien seront contactés.

McGill University is committed to equity and diversity within its community and values academic rigour and excellence. We welcome and encourage applications from racialized persons/visible minorities, women, Indigenous persons, persons with disabilities, ethnic minorities, and persons of minority sexual orientations and gender identities, as well as from all qualified candidates with the skills and knowledge to engage productively with diverse communities.

At McGill, research that reflects diverse intellectual traditions, methodologies, and modes of dissemination and translation is valued and encouraged. Candidates are invited to demonstrate their research impact both within and across academic disciplines and in other sectors, such as government, communities, or industry.

McGill further recognizes and fairly considers the impact of leaves (e.g., family care or health-related) that may contribute to career interruptions or slowdowns. Candidates are encouraged to signal any leave that affected productivity, or that may have had an effect on their career path. This information will be considered to ensure the equitable assessment of the candidate’s record.

McGill implements an employment equity program and encourages members of designated equity groups to self-identify. It further seeks to ensure the equitable treatment and full inclusion of persons with disabilities by striving for the implementation of universal design principles transversally, across all facets of the University community, and through accommodation policies and procedures . Persons with disabilities who anticipate needing accommodations for any part of the application process may contact, in confidence, [email protected] .

All qualified applicants are encouraged to apply; however, in accordance with Canadian immigration requirements, Canadians and permanent residents will be given priority.



Similar Positions