Tech Finder
93 technologies curatées pour le data engineering, l'IA, le cloud et le DevOps. Filtrez par domaine, fournisseur, maturité ou recherchez par mot-clé.
Dagster
Orchestration
Orchestration basée sur les assets avec typage fort et observabilité intégrée
Apache Airflow
Orchestration
L'orchestrateur de workflows basé sur les DAGs le plus déployé, avec un écosystème massif
Kestra
Orchestration
Orchestration déclarative YAML-first avec déclencheurs événementiels
Prefect
Orchestration
Orchestration Python-native avec API simple et modèle d'exécution hybride
MWAA (Managed Airflow)
Orchestration
Service Apache Airflow managé par AWS — aucune infrastructure à gérer
Cloud Composer
Orchestration
Apache Airflow managé par GCP avec intégration étroite à BigQuery
dbt Core
Transformation
Le standard de la transformation SQL avec tests et documentation intégrés
SQLMesh
Transformation
Alternative à dbt avec environnements virtuels et modèles incrémentaux par défaut
Airbyte
Ingestion de données
Plateforme ELT open-source avec plus de 300 connecteurs pour l'intégration de données
Fivetran
Ingestion de données
ELT entièrement managé avec migration de schéma automatique et plus de 500 connecteurs
Meltano / Singer
Ingestion de données
ELT open-source basé sur les taps et targets Singer pour un mouvement de données extensible
Apache Iceberg
Formats de table
Le format de table ouvert dominant — ACID, time travel, partitionnement caché, multi-moteur
Delta Lake
Formats de table
Format de table ouvert né chez Databricks avec un écosystème fort dans le monde Spark
Apache Hudi
Formats de table
Format de table optimisé pour les upserts — perd du terrain face à Iceberg
Apache Kafka
Streaming & Messaging
Plateforme de streaming événementiel distribuée, standard de l'industrie pour les pipelines temps réel
Redpanda
Streaming & Messaging
Plateforme de streaming compatible Kafka — ops simplifiées, sans JVM, sans ZooKeeper
Debezium
Capture de changements (CDC)
Plateforme CDC basée sur les logs pour capturer les changements de base de données en flux d'événements
Great Expectations
Qualité des données
Framework de qualité des données en Python avec attentes déclaratives et profilage
Soda Core
Qualité des données
Checks de qualité des données en YAML — plus simple que Great Expectations pour les cas courants
Elementary
Qualité des données
Observabilité data native dbt — détection d'anomalies et lignage intégrés à dbt
OpenMetadata
Catalogue de données
Standard open-source de catalogue de données avec découverte, lignage et gouvernance
DataHub
Catalogue de données
Plateforme de métadonnées née chez LinkedIn avec intégrations riches et graphe de lignage
Unity Catalog
Catalogue de données
Catalogue universel open-sourcé par Databricks pour les tables, modèles et fonctions
ClickHouse
OLAP & Analytique
Base OLAP colonnaire ultra-rapide — meilleur rapport coût/performance pour les requêtes analytiques
Apache Druid
OLAP & Analytique
OLAP temps réel avec pré-agrégation — requêtes sub-seconde sur des données en streaming
Apache Pinot
OLAP & Analytique
OLAP temps réel par segments — conçu pour l'analytique user-facing à des milliers de QPS
DuckDB
OLAP & Analytique
Base analytique embarquée — le SQLite de l'OLAP. Dev local, notebooks, CI/CD
Snowflake
Entrepôt Cloud
Entrepôt de données SaaS multi-cloud avec séparation du calcul et du stockage
BigQuery
Entrepôt Cloud
Entrepôt serverless GCP — SQL puissant, ML intégré, facturation à la requête
Amazon Redshift
Entrepôt Cloud
Entrepôt AWS basé sur des clusters avec Spectrum pour les requêtes sur le lac de données
Databricks
Plateforme Lakehouse
Plateforme lakehouse unifiée — Delta Lake, Spark, ML et SQL en un seul endroit
PostgreSQL
Relationnel
Le SGBDR open-source le plus avancé — extensible avec pgvector, TimescaleDB, PostGIS
CockroachDB
Relationnel
Base SQL distribuée — compatible PostgreSQL, cohérence globale, résiste aux pannes de zone
Neon
Relationnel
PostgreSQL serverless avec branching — scale to zero, environnements de dev instantanés
MongoDB
Base documentaire
Base documentaire de référence — schéma flexible, scaling horizontal, requêtes riches
Redis / Valkey
Clé-valeur
Store en mémoire pour le cache, les sessions, les classements temps réel et le pub/sub
Neo4j
Base de données graphe
Base de données graphe de référence — langage Cypher, modèle orienté relations
Apache Cassandra
Colonnes larges
Store wide-column distribué — scalabilité linéaire, cohérence configurable
TimescaleDB
Séries temporelles
Extension PostgreSQL pour les séries temporelles — SQL complet, agrégats continus, compression
OpenAI GPT-4o
Modèles de fondation
LLM généraliste le plus performant — multimodal, appels de fonctions, large adoption API
Anthropic Claude
Modèles de fondation
LLM orienté sûreté — contexte long (200K), raisonnement, code et analyse
Meta Llama 3
Modèles de fondation
LLM open-weight de référence — compétitif avec le propriétaire, fine-tunable, auto-hébergeable
Mistral AI
Modèles de fondation
Labo IA français — modèles MoE efficaces, fort en multilingue, leader de l'IA souveraine EU
LangChain
Frameworks LLM
Framework le plus populaire pour construire des applications LLM — chaînes, agents, retrieval
LlamaIndex
Frameworks LLM
Framework de données pour LLMs — indexation, retrieval et pipelines RAG de référence
LangGraph
Frameworks d'agents
Framework d'agents stateful basé sur LangChain — graphes, cycles, humain dans la boucle
Pinecone
Base vectorielle
Base vectorielle serverless dédiée — le chemin le plus simple vers un RAG en production
Weaviate
Base vectorielle
Base vectorielle open-source avec recherche hybride native (vecteur + mot-clé)
Qdrant
Base vectorielle
Base vectorielle haute performance en Rust avec filtrage riche sur les payloads
pgvector
Base vectorielle
Extension PostgreSQL pour la recherche vectorielle — aucune nouvelle infrastructure requise
MLflow
Plateforme MLOps
Plateforme MLOps open-source — suivi d'expériences, registre de modèles, déploiement
AWS SageMaker
Plateforme MLOps
Plateforme ML AWS de bout en bout — entraînement, tuning, déploiement et monitoring de modèles
GCP Vertex AI
Plateforme MLOps
Plateforme ML unifiée GCP — AutoML, entraînement custom, API Gemini, feature store
Kubeflow
Plateforme MLOps
Pipelines ML natifs Kubernetes — workflows ML portables et scalables sur tout cloud
vLLM
Inférence LLM
Moteur de serving LLM haut débit avec PagedAttention — l'option open-source la plus rapide
Ollama
Inférence LLM
Exécutez des LLMs en local en une commande — simplicité Docker pour l'IA locale
Feast
Feature Store
Feature store open-source — serving online/offline, exactitude point-in-time
Gretel.ai
Données synthétiques
Plateforme de données synthétiques avec confidentialité différentielle — génération conforme RGPD
Looker
Plateforme BI
BI propulsé par LookML avec forte cohérence des métriques — idéal pour l'analytique gouvernée
Tableau
Plateforme BI
Exploration visuelle et conception de dashboards de référence pour les analystes avancés
Power BI
Plateforme BI
BI Microsoft avec tarification agressive et intégration profonde Office 365 / Azure
Metabase
Plateforme BI
BI open-source pour le self-service rapide — les utilisateurs non techniques requêtent sans SQL
Apache Superset
Plateforme BI
BI open-source flexible avec IDE SQL, visualisations riches et RBAC
Evidence
Plateforme BI
BI code-first — rédigez des rapports en Markdown avec SQL, dashboards versionnés
Cube
Couche sémantique
Couche sémantique universelle — API REST/GraphQL/SQL, cache multi-niveaux, tout outil BI
dbt Semantic Layer
Couche sémantique
Couche sémantique MetricFlow intégrée à dbt — métriques as code, source unique de vérité
Kubernetes
Orchestration de conteneurs
Le standard de l'orchestration de conteneurs — déclaratif, extensible, portable
Amazon EKS
Orchestration de conteneurs
Kubernetes managé AWS — intégration profonde IAM/VPC, Fargate pour les pods serverless
Google GKE
Orchestration de conteneurs
Kubernetes managé GCP — mode Autopilot, mises à jour K8s les plus rapides
Terraform / OpenTofu
Infrastructure as Code
Le standard IaC — déclaratif, multi-cloud, écosystème de providers massif
Pulumi
Infrastructure as Code
IaC avec de vrais langages de programmation (Python, TypeScript, Go) au lieu de HCL
Crossplane
Infrastructure as Code
IaC natif Kubernetes — gérez les ressources cloud comme des custom resources K8s
GitHub Actions
CI/CD
CI/CD intégré à GitHub — workflows YAML, marketplace massive, intégration OIDC
ArgoCD
CI/CD
Livraison continue GitOps pour Kubernetes — déclaratif, auditable, auto-réparant
Prometheus
Observabilité
Collecte de métriques pull-based — le standard pour le monitoring Kubernetes
Grafana
Observabilité
La couche de visualisation pour l'observabilité — dashboards, alertes, multi-sources
OpenTelemetry
Observabilité
Standard d'observabilité vendor-neutral — traces, métriques, logs avec un seul SDK
Datadog
Observabilité
Observabilité commerciale complète — APM, logs, métriques, sécurité en une plateforme
Backstage
Platform Engineering
Portail développeur né chez Spotify — catalogue de services, templates, écosystème de plugins
OpenCost
FinOps
Projet CNCF pour le monitoring des coûts Kubernetes — allocation temps réel, multi-cloud
HashiCorp Vault
Gestion des secrets
Plateforme complète de gestion des secrets — secrets dynamiques, PKI, multi-cloud, ACL granulaire
AWS Secrets Manager
Gestion des secrets
Secrets managés AWS avec rotation automatique via Lambda et intégration IAM
Sigstore / Cosign
Sécurité de la chaîne logicielle
Signature sans clé des conteneurs et artefacts — vérification de provenance, sans gestion de clés
Trivy
Scan de vulnérabilités
Scanner de sécurité tout-en-un — conteneurs, systèmes de fichiers, IaC, génération SBOM
Kyverno
Application de politiques
Moteur de politiques natif Kubernetes — validation, mutation et génération de ressources en YAML
OPA / Gatekeeper
Application de politiques
Moteur de politiques généraliste (Rego) — admission K8s, autorisation API, checks IaC
Python
Langage de programmation
Lingua franca du data engineering et du ML — pandas, PySpark, dbt, bibliothèques ML
SQL
Langage de requête
Irremplaçable pour l'analytique — chaque entrepôt, chaque outil BI, chaque rôle data
Polars
Bibliothèque DataFrame
Bibliothèque DataFrame propulsée par Rust — 10-100x plus rapide que pandas, évaluation lazy
Apache Arrow
Format de données
Format colonnaire en mémoire — partage zero-copy entre systèmes, agnostique du langage
PyTorch
Framework ML
Framework dominant de deep learning — standard en recherche, production-ready avec TorchServe
Hugging Face
Plateforme ML
Le GitHub du ML — hub de modèles, bibliothèque Transformers, datasets, Spaces pour les démos
Rust (data tooling)
Langage de programmation
Propulse les outils data nouvelle génération — Polars, Delta-rs, DataFusion, chemins critiques en performance