Job description
Tether, start‑up innovante spécialisée dans les technologies d’intelligence artificielle de nouvelle génération, recherche un Ingénieur Recherche IA senior pour rejoindre son équipe de modèles IA à San Francisco. Vous intégrerez une équipe multidisciplinaire composée de chercheurs, d’ingénieurs en infrastructure et de data scientists, et vous participerez à la conception, à l’optimisation et au déploiement de modèles de grande taille, incluant des architectures multimodales (texte, image, audio).
**Missions principales**
- Concevoir et implémenter des architectures de modèles IA novatrices, capables de s’adapter à différents domaines d’application (NLP, vision, audio).
- Piloter le pré‑entraînement de modèles à grande échelle sur des clusters distribués comptant plusieurs milliers de GPU NVIDIA, en assurant l’efficacité du pipeline de formation (data loading, parallélisation, gestion de la mémoire).
- Curater, nettoyer et enrichir les jeux de données massifs nécessaires au pré‑entraînement, en appliquant des techniques avancées de filtrage, d’augmentation et de déséquilibrage.
- Optimiser les performances des modèles (vitesse, consommation énergétique, précision) grâce à des approches de quantisation, de pruning et de distillation.
- Identifier et résoudre les goulets d’étranglement liés à l’infrastructure, au réseau ou aux algorithmes, en collaborant étroitement avec les équipes DevOps et Cloud.
- Contribuer à la rédaction d’articles scientifiques, de rapports techniques et à la diffusion des résultats lors de conférences internationales.
- Encadrer et mentorer les ingénieurs plus juniors, favoriser le partage de connaissances et promouvoir les bonnes pratiques de développement IA.
**Profil recherché**
- Diplôme d’ingénieur ou Master/PhD en informatique, IA, mathématiques appliquées ou domaine équivalent.
- Minimum 5 ans d’expérience professionnelle en recherche appliquée ou en ingénierie IA, idéalement sur des modèles de type transformer ou diffusion.
- Maîtrise des frameworks PyTorch, TensorFlow ou JAX, ainsi que des bibliothèques de parallélisation (DeepSpeed, Megatron‑LM, Horovod).
- Expérience avérée dans le pré‑entraînement de modèles à grande échelle sur des clusters GPU, incluant la gestion de pipelines de données distribuées.
- Solides compétences en algorithmique, optimisation numérique et programmation (Python, C++).
- Connaissance des systèmes de stockage haute performance (Ceph, Lustre) et des environnements cloud (AWS, GCP).
- Capacité à travailler en anglais à l’oral comme à l’écrit, esprit d’équipe et autonomie.
**Ce que nous offrons**
- Un environnement de travail stimulant au cœur de la Silicon Valley, avec des bureaux modernes et des espaces de collaboration.
- Accès à une infrastructure de pointe (plus de 10 000 GPU NVIDIA A100) pour repousser les limites de la recherche IA.
- Rémunération compétitive, bonus basés sur la performance et participation au capital de l’entreprise.
- Programme de formation continue, conférences, ateliers et budget dédié à la publication scientifique.
- Politique de congés généreuse, assurance santé premium et avantages liés au bien‑être (salle de sport, repas sains).
- Culture d’entreprise inclusive, favorisant la diversité et l’innovation.
Rejoignez Tether et contribuez à façonner l’avenir de l’intelligence artificielle en travaillant sur des projets à fort impact mondial.