12 meilleures offres (data architect freelance, paris, a8) (à pourvoir)

Testeur QA IA Gen - Freelance H/F
Collective.work —Paris (75)
- 300 € par jour
- Temps plein
- Azure
- Anglais
- Scripting
7 h
Architecte Data - Migration BI & Modélisation - Freelance H/F
Collective.work —Saint-Ouen (93)
- De 700 € à 760 € par jour
- Temps plein
1 h
Project Design Authority Senior Safe City (IT) / Freelance
EBMC —Vélizy-Villacoublay (78)
- De 400 € à 650 € par jour
- Anglais
- Esprit d'analyse
- Intelligence artificielle
il y a 1 jour
Tech Lead Full Stack JAVA / REACT (IT) / Freelance
Hexagone Digitale —Paris (75)
- Azure
- Java
- Expérience en supervision
Consultant Urbaniste SI â€“ HOPEX H/F
ami consulting —Neuilly-sur-Seine (92)
- Temps plein
- Anglais
Postuler rapidement
il y a 9 jours
POT9226 - Un Architecte Solution Senior sur Vélizy-Villacoublay. (IT) / Freelance
Almatek —Vélizy-Villacoublay (78)
- Anglais
- Esprit d'analyse
- Intelligence artificielle
il y a 5 jours
Chef de projet Marketing assurance H/F
SYD Groupe —Levallois-Perret (92)
- Temps plein
- Marketing
- Service client
- Ingénierie
Postuler rapidement
7 h
Architecte digital à vocation Conseil H/F
ZeTrace —Paris (75)
- Temps plein
- Télétravail partiel
- Schémas
- Sens de l'organisation
Architecte Solutions (H/F)
DHM GROUP —Neuilly-sur-Seine (92)
- Temps plein
- Anglais
- Java
- AWS
Senior Data Engineer Azure (H/F)
Scalian —Neuilly-sur-Seine (92)
- Jusqu’à 65 000 € par an
- Temps plein
- Azure
- Anglais
- Agile
- Programme de recommandation
Postuler rapidement
Architecte GenAI / Guyancourt ou Montpellier - F/H
AVANISTA —Guyancourt (78)
- Appeler l'employeur
- Informatique
- AWS
- Intelligence artificielle
- Opportunités de carrières
Architecte Data Platform - Freelance
Collective.work —Paris (75)
- 500 € par jour
- Temps plein
- Azure
- AWS
1 h

More jobs to discover

Find similar jobs that you might be interested in.

Architecte Data - Migration BI & Modélisation - Freelance H/F
Collective.work —Saint-Ouen (93)
Au-delà de la migration, vous serez un interlocuteur clé sur les choix d'architecture Data à long terme - une vraie opportunité de laisser une empreinte durable…
De 700 € à 760 € par jour
1 h

Je souhaite recevoir la dernière alerte Emploi pour les postes de ce type : data architect freelance (paris, a8)

En vous connectant à votre compte, vous acceptez les Conditions d'utilisation de SimplyHired et consentez à notre Politique relative aux cookies et Politique de confidentialité.

Testeur QA IA Gen - Freelance H/F

Collective.work
Paris (75)

Soumettre votre candidature

Détails de l'emploi

Temps plein | Indépendant / freelance
300 € par jour
Il y a 7 heures

Qualifications

Azure
Git
Anglais
Docker
Scripting
Toiture
Python
HTML

Description complète du poste

Description du poste

Taux journalier (TJM): 300

Missions

Stratégie et cadrage de la recette (20 %)

Définir la stratégie de recette et les plans de test associés à chaque cas d'usage RAG Agentique (cadrage fonctionnel et technique, critères d'acceptation, métriques d'évaluation).
Formaliser les jeux de tests, les golden sets et les protocoles d'évaluation propres à un système RAG : pertinence, fidélité (faithfulness), groundedness, hallucinations, robustesse aux prompts adverses, latence, coût.
Contribuer à la gouvernance qualité des 50+ cas d'usage : matrice de couverture, suivi de non-régression, rituels de validation, comités de mise en production.

Implémentation et exécution des recettes (80 %)

Scripting et automatisation des campagnes de test (Python principalement) : exécution massive, parallélisation, collecte de logs et de métriques.
Construction et maintenance des datasets de recette : extraction et préparation de corpus, parsing de documents hétérogènes (PDF, HTML, Office, scans OCR), chunking adapté aux uses cases.
Génération d'embeddings de test et validation des index vectoriels (recall@k, MRR, qualité de la similarité, taille de chunks, stratégies de fenêtrage).
Tests des workflows agentiques : validation des chaînes d'agents, des outils invoqués (function calling), du routage des intentions, de la gestion d'erreurs et des fallbacks.
Mise en place d'évaluations LLM-as-a-judge (rubrics, scoring automatique, calibration par échantillonnage humain).
Tests de non-régression sur prompts, modèles (changements de version) et sources documentaires (mises à jour de la base).
Tests de robustesse et de sécurité : jailbreak, prompt injection, leakage de données sensibles, biais, conformité aux exigences réglementaires bancaires.
Reporting des défauts et collaboration directe avec les équipes Data/ML/Dev pour le débogage et la correction.
Contribution à l'outillage de recette : développement de helpers internes, intégration aux pipelines CI/CD, dashboards de qualité (Streamlit, Grafana, etc.).

Communication et accompagnement

Restituer les résultats de recette de manière synthétique aux Product Owners, équipes IT et métiers.
Documenter les bonnes pratiques de recette IA générative et contribuer au socle méthodologique de l'équipe Assets IA.
Participer aux communautés QA / GenAI 4 Dev du Groupe et y partager les retours d'expérience.

Compétences techniques attendues

Expérience confirmée en recette / QA sur des produits data, IA ou applicatifs critiques (idéalement secteur bancaire/assurance).
Maîtrise solide de Python : scripting, automatisation, manipulation de données, librairies de test (pytest, unittest).
Connaissance pratique des composants RAG : parsing (Unstructured, PyMuPDF, LlamaParse), chunking (recursive, semantic, hybride), modèles d'embeddings (OpenAI, Mistral, Cohere, BGE, etc.), bases vectorielles (Pinecone, Weaviate, Qdrant, FAISS, pgvector), reranking.
Connaissance des frameworks LLM/Agents : LangChain, LlamaIndex, LangGraph, Semantic Kernel, ou équivalents propriétaires.
Frameworks d'évaluation RAG : RAGAS, TruLens, DeepEval, Promptfoo, Giskard, Arize Phoenix, ou benchmarks internes.
Pratique de l'orchestration de workflows : génération et test de workflows agentiques (LangGraph, n8n, Make, ou framework maison).
Manipulation d'API LLM : OpenAI, Azure OpenAI, Anthropic, Mistral, Bedrock — gestion du rate limiting, retry, instrumentation.
Git, CI/CD, Docker : intégration des tests aux pipelines, capacité à industrialiser une chaîne de recette.
Notions de MLOps / LLMOps : versioning de prompts, tracking d'expérimentations (MLflow, Weights & Biases, Langfuse), monitoring de production.
Capacité à réaliser des expérimentations techniques (POC de scripts d'évaluation, prototypes de pipelines de recette) en autonomie.

Soft skills

Rigueur et esprit d'analyse poussés — la qualité d'un système RAG se joue dans le détail.
Pragmatisme et capacité à arbitrer entre couverture exhaustive et délais industriels.
Excellentes capacités rédactionnelles (rapports de recette, documentation technique) et de présentation orale.
Curiosité technologique : veille active sur les méthodes d'évaluation des LLM et systèmes agentiques.
Coordination, sens du service et du dialogue avec des interlocuteurs variés (Data Scientists, Devs, Architects, PO, métiers).
Capacité d'initiative, force de proposition sur l'amélioration des process de recette.
Anglais courant impératif pour ce poste (documentation technique, échanges internationaux).

Profil recherché

Expérience confirmée en recette / QA sur des produits data, IA ou applicatifs critiques (idéalement secteur bancaire/assurance)

Maîtrise solide de Python : scripting, automatisation, manipulation de données, librairies de test (pytest, unittest)

Connaissance pratique des composants RAG : parsing (Unstructured, PyMuPDF, LlamaParse), chunking (recursive, semantic, hybride), modèles d'embeddings (OpenAI, Mistral, Cohere, BGE, etc.), bases vectorielles (Pinecone, Weaviate, Qdrant, FAISS, pgvector), reranking

Connaissance des frameworks LLM/Agents : LangChain, LlamaIndex, LangGraph, Semantic Kernel, ou équivalents propriétaires

Connaissance des frameworks d'évaluation RAG : RAGAS, TruLens, DeepEval, Promptfoo, Giskard, Arize Phoenix, ou benchmarks internes

Pratique de l'orchestration de workflows : génération et test de workflows agentiques (LangGraph, n8n, Make, ou framework maison)

Manipulation d'API LLM : OpenAI, Azure OpenAI, Anthropic, Mistral, Bedrock — gestion du rate limiting, retry, instrumentation

Git, CI/CD, Docker : intégration des tests aux pipelines, capacité à industrialiser une chaîne de recette

Notions de MLOps / LLMOps : versioning de prompts, tracking d'expérimentations (MLflow, Weights & Biases, Langfuse), monitoring de production

Capacité à réaliser des expérimentations techniques (POC de scripts d'évaluation, prototypes de pipelines de recette) en autonomie

Rigueur et esprit d'analyse poussés

Pragmatisme et capacité à arbitrer entre couverture exhaustive et délais industriels

Excellentes capacités rédactionnelles et de présentation orale

Curiosité technologique : veille active sur les méthodes d'évaluation des LLM et systèmes agentiques

Coordination, sens du service et du dialogue avec des interlocuteurs variés (Data Scientists, Devs, Architects, PO, métiers)

Capacité d'initiative, force de proposition sur l'amélioration des process de recette

Anglais courant impératif pour ce poste (documentation technique, échanges internationaux)

Soumettre votre candidature

Affinez votre recherche

data architect freelance emplois - paris, a8

Testeur QA IA Gen - Freelance H/F

Architecte Data - Migration BI & Modélisation - Freelance H/F

Project Design Authority Senior Safe City (IT) / Freelance

Tech Lead Full Stack JAVA / REACT (IT) / Freelance

Consultant Urbaniste SI â€“ HOPEX H/F

POT9226 - Un Architecte Solution Senior sur Vélizy-Villacoublay. (IT) / Freelance

Chef de projet Marketing assurance H/F

Architecte digital à vocation Conseil H/F

Architecte Solutions (H/F)

Senior Data Engineer Azure (H/F)

Architecte GenAI / Guyancourt ou Montpellier - F/H

Architecte Data Platform - Freelance

More jobs to discover

Je souhaite recevoir la dernière alerte Emploi pour les postes de ce type : data architect freelance (paris, a8)

Related Searches

Description du poste

Missions

Compétences techniques attendues

Soft skills

Outils pour les chercheurs d'emploi

Outils Employeurs

Parcourir

Garder le contact