New
Remote
Job description
Mercor, start‑up innovante basée à San Francisco, se spécialise dans le développement d’environnements d’apprentissage agentique destinés à résoudre des problématiques industrielles et scientifiques complexes. Dans le cadre de son expansion, nous recherchons un·e professeur·e en STEM (actif·ve ou retraité·e) capable de concevoir, implémenter et évaluer des jeux de données et des scénarios d’évaluation réalistes pour nos modèles d’IA. Vous travaillerez en étroite collaboration avec nos équipes de recherche, d’ingénierie et de produit afin de garantir que les agents intelligents développés par Mercur soient capables de raisonner, d’apprendre et d’opérer dans des contextes réels.
**Missions principales**
- Analyser les besoins de différents domaines (robotique, finance, santé, énergie, etc.) et traduire ces exigences en problèmes d’apprentissage agentique concrets.
- Rédiger des consignes détaillées, créer des jeux de données annotés et fournir des solutions de référence (ground‑truth) pour chaque tâche.
- Mettre en place des protocoles d’évaluation robustes : métriques de performance, tests de robustesse, analyses d’erreurs logiques et suivi de la perte de capacités au fil du temps.
- Identifier et documenter les cas d’échec de raisonnement logique, proposer des hypothèses d’amélioration et travailler avec les ingénieurs pour itérer les modèles.
- Concevoir et animer des modules de formation (webinars, ateliers, tutoriels) destinés aux équipes internes et aux partenaires externes afin de diffuser les bonnes pratiques d’évaluation et de conception de tâches IA.
- Rédiger des rapports d’analyse, des publications internes et, le cas échéant, des articles scientifiques ou techniques.
**Profil recherché**
- Doctorat ou expérience équivalente en informatique, mathématiques, physique, ingénierie ou discipline STEM connexe.
- Minimum 5 ans d’expérience en recherche appliquée en IA (apprentissage par renforcement, apprentissage supervisé, IA explicable, etc.) ou en enseignement supérieur.
- Maîtrise des langages de programmation Python, TensorFlow/PyTorch et des outils de gestion de données (SQL, NoSQL, Git).
- Expertise avérée dans la conception de benchmarks, la création de jeux de données et l’évaluation de modèles IA.
- Excellentes compétences de communication écrite et orale, capacité à vulgariser des concepts complexes pour des publics variés.
- Autonomie, rigueur scientifique et esprit d’équipe.
- Disponibilité d’au moins 30 heures par semaine, avec flexibilité pour travailler à distance.
**Ce que nous offrons**
- Rémunération attractive jusqu’à 85 USD de l’heure, selon expérience et niveau d’expertise.
- Contrat à temps partiel (30 h / semaine) avec possibilité d’évolution vers un poste plus complet.
- Environnement de travail stimulant, projets à fort impact et accès à des ressources de calcul de pointe.
- Liberté d’organiser votre planning (remote) tout en restant connecté aux équipes via Slack, Zoom et réunions mensuelles à San Francisco.
- Opportunité de publier vos travaux, de participer à des conférences internationales et d’enrichir votre réseau professionnel.
Rejoignez Mercor et contribuez à façonner la prochaine génération d’agents intelligents capables de résoudre les défis les plus complexes du monde réel.