جديد
وصف الوظيفة
STACK Construction Technologies est un leader du SaaS B2B dédié à la digitalisation du secteur du BTP. Forts d’une équipe de plus de 130 experts et d’une plateforme robuste utilisée par des dizaines de grandes entreprises de construction, nous transformons la manière dont les plans, devis et documents techniques sont ingérés, analysés et exploités. Dans le cadre de notre ambition d’offrir une solution de bout en bout pour la gestion des documents de chantier, nous recherchons un(e) Ingénieur(e) Senior en Vision par Ordinateur capable de concevoir, optimiser et mettre en production des pipelines de détection et de segmentation d’images très performants.
**Missions principales**
- Concevoir et développer des pipelines end‑to‑end de détection et de segmentation pour des images de documents (plans, schémas, PDF, dessins techniques).
- Améliorer l’ingestion de documents non structurés (PDF multi‑pages, fichiers DWG, images scannées) en optimisant le rendu, le parsing et la gestion des vues multiples.
- Augmenter la précision des modèles, la qualité des frontières géométriques et la fiabilité des prédictions afin de soutenir les processus downstream (estimation de quantités, génération de métrés, conformité).
- Intégrer les modèles de détection/segmentation les plus récents (Transformers, CNN hybrides, modèles multimodaux) dans les workflows de production et développer le post‑processing qui transforme les sorties en géométrie structurée exploitable.
- Définir et suivre des métriques d’évaluation (IoU, précision, rappel, latence) ; analyser les cas d’échec et piloter les améliorations continues.
- Optimiser la latence, la fiabilité et le coût du stack d’inférence et de post‑processing (GPU, CPU, serveurs sans‑serveur).
- Gérer l’infrastructure d’entraînement, la curation de jeux de données, la qualité d’annotation et les boucles d’amélioration continue.
- Prendre des décisions architecturales majeures et garantir la qualité du système de bout en bout.
**Profil recherché**
- Minimum 5 ans d’expérience dans la conception de systèmes de vision par ordinateur (détection, segmentation, extraction de géométrie structurée) déployés à grande échelle.
- Maîtrise des frameworks deep learning (PyTorch, TensorFlow) et des bibliothèques de traitement d’image (OpenCV, Albumentations).
- Expérience avérée avec des données réelles et bruitées (documents scannés, PDF complexes, dessins techniques).
- Solide compréhension des compromis entre architectures de modèles, conception de jeux de données et post‑processing.
- Capacité à définir des métriques de performance, à diagnostiquer les défaillances et à itérer rapidement.
- Connaissance des modèles multimodaux (vision‑langage, Document AI) et des techniques de grounding.
- Compétences en ingénierie de données (pipeline d’ingestion, annotation, gestion de gros volumes).
- Excellent sens de la communication, capacité à vulgariser les problèmes techniques auprès d’équipes produit et business.
**Ce que nous offrons**
- Un environnement de travail stimulant au sein d’une start‑up en pleine croissance, avec une culture d’innovation et de collaboration.
- Possibilité de travailler en mode hybride (bureau à New York ou télétravail).
- Accès à des ressources de calcul de pointe (GPU, cloud).
- Programme de formation continue et budget dédié à la participation à des conférences internationales.
- Rémunération compétitive, bonus basé sur les performances et avantages sociaux complets.
Rejoignez-nous pour façonner l’avenir de la digitalisation du secteur de la construction et contribuer à des projets à fort impact qui simplifient le quotidien des professionnels du BTP.