tadata

Tech Finder

93 technologies curatées pour le data engineering, l'IA, le cloud et le DevOps. Filtrez par domaine, fournisseur, maturité ou recherchez par mot-clé.

93 sur 93 technologies

Dagster

Orchestration

AdopterOpen Source

Orchestration basée sur les assets avec typage fort et observabilité intégrée

data pipelinesasset orchestrationdbt integration

Apache Airflow

Orchestration

Open Source

L'orchestrateur de workflows basé sur les DAGs le plus déployé, avec un écosystème massif

data pipelinesETL schedulingworkflow automation

Kestra

Orchestration

ÉvaluerOpen Source

Orchestration déclarative YAML-first avec déclencheurs événementiels

event-driven pipelineslow-code orchestration

Prefect

Orchestration

EssayerOpen Source

Orchestration Python-native avec API simple et modèle d'exécution hybride

data pipelinesML workflowsPython automation

MWAA (Managed Airflow)

Orchestration

AWS

Service Apache Airflow managé par AWS — aucune infrastructure à gérer

AWS-native pipelinesmanaged Airflow
ManagéLire plus

Cloud Composer

Orchestration

GCP

Apache Airflow managé par GCP avec intégration étroite à BigQuery

GCP-native pipelinesBigQuery orchestration
ManagéLire plus

dbt Core

Transformation

AdopterOpen Source

Le standard de la transformation SQL avec tests et documentation intégrés

SQL transformationdata modelinganalytics engineering

SQLMesh

Transformation

ÉvaluerOpen Source

Alternative à dbt avec environnements virtuels et modèles incrémentaux par défaut

SQL transformationvirtual data environments

Airbyte

Ingestion de données

EssayerOpen Source

Plateforme ELT open-source avec plus de 300 connecteurs pour l'intégration de données

ELTdata replicationconnector coverage

Fivetran

Ingestion de données

Commercial

ELT entièrement managé avec migration de schéma automatique et plus de 500 connecteurs

managed ELTSaaS data replicationzero maintenance
CommercialLire plus

Meltano / Singer

Ingestion de données

Open Source

ELT open-source basé sur les taps et targets Singer pour un mouvement de données extensible

open-source ELTcustom connectorsCLI-first

Apache Iceberg

Formats de table

AdopterOpen Source

Le format de table ouvert dominant — ACID, time travel, partitionnement caché, multi-moteur

lakehousedata lake governancemulti-engine analytics

Delta Lake

Formats de table

EssayerOpen Source

Format de table ouvert né chez Databricks avec un écosystème fort dans le monde Spark

Databricks lakehouseSpark workloadsunified batch/streaming

Apache Hudi

Formats de table

SuspendreOpen Source

Format de table optimisé pour les upserts — perd du terrain face à Iceberg

upsert-heavy workloadsmerge-on-read

Apache Kafka

Streaming & Messaging

Open Source

Plateforme de streaming événementiel distribuée, standard de l'industrie pour les pipelines temps réel

event streamingCDCreal-time pipelinesmicroservices messaging

Redpanda

Streaming & Messaging

EssayerOpen Source

Plateforme de streaming compatible Kafka — ops simplifiées, sans JVM, sans ZooKeeper

Kafka replacementsimpler streaminglow-latency events

Debezium

Capture de changements (CDC)

Open Source

Plateforme CDC basée sur les logs pour capturer les changements de base de données en flux d'événements

CDCdatabase replicationevent sourcing

Great Expectations

Qualité des données

EssayerOpen Source

Framework de qualité des données en Python avec attentes déclaratives et profilage

data validationpipeline testingdata profiling

Soda Core

Qualité des données

EssayerOpen Source

Checks de qualité des données en YAML — plus simple que Great Expectations pour les cas courants

data quality checksfreshness monitoringSodaCL

Elementary

Qualité des données

EssayerOpen Source

Observabilité data native dbt — détection d'anomalies et lignage intégrés à dbt

dbt observabilityanomaly detectiondata lineage

OpenMetadata

Catalogue de données

AdopterOpen Source

Standard open-source de catalogue de données avec découverte, lignage et gouvernance

data discoverymetadata managementdata governance

DataHub

Catalogue de données

Open Source

Plateforme de métadonnées née chez LinkedIn avec intégrations riches et graphe de lignage

metadata managementdata lineagedata discovery

Unity Catalog

Catalogue de données

EssayerOpen Source

Catalogue universel open-sourcé par Databricks pour les tables, modèles et fonctions

multi-engine catalogIceberg cataloguniversal governance

ClickHouse

OLAP & Analytique

AdopterOpen Source

Base OLAP colonnaire ultra-rapide — meilleur rapport coût/performance pour les requêtes analytiques

real-time analyticsOLAP servinglog analyticscost-effective at scale

Apache Druid

OLAP & Analytique

EssayerOpen Source

OLAP temps réel avec pré-agrégation — requêtes sub-seconde sur des données en streaming

real-time dashboardstime-series analyticshigh-concurrency serving

Apache Pinot

OLAP & Analytique

EssayerOpen Source

OLAP temps réel par segments — conçu pour l'analytique user-facing à des milliers de QPS

user-facing analyticsreal-time dashboardshigh-concurrency OLAP

DuckDB

OLAP & Analytique

AdopterOpen Source

Base analytique embarquée — le SQLite de l'OLAP. Dev local, notebooks, CI/CD

local analyticsdev/testembedded BInotebook queries

Snowflake

Entrepôt Cloud

Commercial

Entrepôt de données SaaS multi-cloud avec séparation du calcul et du stockage

cloud warehousemulti-cloud analyticsdata sharing
CommercialLire plus

BigQuery

Entrepôt Cloud

GCP

Entrepôt serverless GCP — SQL puissant, ML intégré, facturation à la requête

GCP analyticsserverless warehousepetabyte-scale SQL
ManagéLire plus

Amazon Redshift

Entrepôt Cloud

AWS

Entrepôt AWS basé sur des clusters avec Spectrum pour les requêtes sur le lac de données

AWS analyticsdata warehouseBI workloads
ManagéLire plus

Databricks

Plateforme Lakehouse

Commercial

Plateforme lakehouse unifiée — Delta Lake, Spark, ML et SQL en un seul endroit

lakehouseSpark workloadsML platformunified analytics
CommercialLire plus

PostgreSQL

Relationnel

Open Source

Le SGBDR open-source le plus avancé — extensible avec pgvector, TimescaleDB, PostGIS

OLTPstructured dataextensible databasesingle-node workloads

CockroachDB

Relationnel

Open Source

Base SQL distribuée — compatible PostgreSQL, cohérence globale, résiste aux pannes de zone

distributed SQLglobal appsmulti-region OLTP
FreemiumLire plus

Neon

Relationnel

Commercial

PostgreSQL serverless avec branching — scale to zero, environnements de dev instantanés

serverless PostgreSQLdev environmentsbranching databases
FreemiumLire plus

MongoDB

Base documentaire

Open Source

Base documentaire de référence — schéma flexible, scaling horizontal, requêtes riches

document storageflexible schemacontent managementcatalogs
FreemiumLire plus

Redis / Valkey

Clé-valeur

Open Source

Store en mémoire pour le cache, les sessions, les classements temps réel et le pub/sub

cachingsession storereal-time datarate limiting

Neo4j

Base de données graphe

Open Source

Base de données graphe de référence — langage Cypher, modèle orienté relations

knowledge graphsfraud detectionrecommendationssocial networks
FreemiumLire plus

Apache Cassandra

Colonnes larges

Open Source

Store wide-column distribué — scalabilité linéaire, cohérence configurable

time-serieswrite-heavy workloadsIoT dataglobal distribution

TimescaleDB

Séries temporelles

Open Source

Extension PostgreSQL pour les séries temporelles — SQL complet, agrégats continus, compression

time-series analyticsIoTmetrics storageobservability

OpenAI GPT-4o

Modèles de fondation

Commercial

LLM généraliste le plus performant — multimodal, appels de fonctions, large adoption API

chatcode generationreasoningmultimodal
CommercialLire plus

Anthropic Claude

Modèles de fondation

Commercial

LLM orienté sûreté — contexte long (200K), raisonnement, code et analyse

long-context analysiscodingsafety-critical AIenterprise
CommercialLire plus

Meta Llama 3

Modèles de fondation

Open Source

LLM open-weight de référence — compétitif avec le propriétaire, fine-tunable, auto-hébergeable

self-hosted LLMfine-tuningon-premise AIcost control

Mistral AI

Modèles de fondation

EU

Labo IA français — modèles MoE efficaces, fort en multilingue, leader de l'IA souveraine EU

EU-sovereign AImultilingualefficient inferenceMoE

LangChain

Frameworks LLM

Open Source

Framework le plus populaire pour construire des applications LLM — chaînes, agents, retrieval

RAGLLM appsagent buildingprompt chaining

LlamaIndex

Frameworks LLM

Open Source

Framework de données pour LLMs — indexation, retrieval et pipelines RAG de référence

RAGdocument indexingstructured data queries

LangGraph

Frameworks d'agents

Open Source

Framework d'agents stateful basé sur LangChain — graphes, cycles, humain dans la boucle

AI agentsmulti-step reasoningstateful workflows

Pinecone

Base vectorielle

Commercial

Base vectorielle serverless dédiée — le chemin le plus simple vers un RAG en production

RAGsemantic searchrecommendation engines
CommercialLire plus

Weaviate

Base vectorielle

Open Source

Base vectorielle open-source avec recherche hybride native (vecteur + mot-clé)

hybrid searchRAGmulti-modal search

Qdrant

Base vectorielle

Open Source

Base vectorielle haute performance en Rust avec filtrage riche sur les payloads

RAGsimilarity searchrecommendationhigh-performance

pgvector

Base vectorielle

Open Source

Extension PostgreSQL pour la recherche vectorielle — aucune nouvelle infrastructure requise

small-medium RAGexisting PostgreSQL userssimple vector search

MLflow

Plateforme MLOps

Open Source

Plateforme MLOps open-source — suivi d'expériences, registre de modèles, déploiement

experiment trackingmodel registryML lifecycle

AWS SageMaker

Plateforme MLOps

AWS

Plateforme ML AWS de bout en bout — entraînement, tuning, déploiement et monitoring de modèles

AWS ML workloadsmanaged trainingmodel hosting
ManagéLire plus

GCP Vertex AI

Plateforme MLOps

GCP

Plateforme ML unifiée GCP — AutoML, entraînement custom, API Gemini, feature store

GCP ML workloadsAutoMLGemini integration
ManagéLire plus

Kubeflow

Plateforme MLOps

Open Source

Pipelines ML natifs Kubernetes — workflows ML portables et scalables sur tout cloud

ML pipelinesKubernetes MLmulti-cloud ML

vLLM

Inférence LLM

Open Source

Moteur de serving LLM haut débit avec PagedAttention — l'option open-source la plus rapide

LLM servinghigh-throughput inferenceself-hosted AI

Ollama

Inférence LLM

Open Source

Exécutez des LLMs en local en une commande — simplicité Docker pour l'IA locale

local LLMdeveloper testingprivacy-first AI

Feast

Feature Store

Open Source

Feature store open-source — serving online/offline, exactitude point-in-time

ML feature managementonline servingfeature reuse

Gretel.ai

Données synthétiques

Commercial

Plateforme de données synthétiques avec confidentialité différentielle — génération conforme RGPD

privacy-preserving datatest data generationdata augmentation
FreemiumLire plus

Looker

Plateforme BI

GCP

BI propulsé par LookML avec forte cohérence des métriques — idéal pour l'analytique gouvernée

governed BImetric consistencysemantic layerenterprise analytics
CommercialLire plus

Tableau

Plateforme BI

Commercial

Exploration visuelle et conception de dashboards de référence pour les analystes avancés

visual analyticsad-hoc explorationexecutive dashboards
CommercialLire plus

Power BI

Plateforme BI

Azure

BI Microsoft avec tarification agressive et intégration profonde Office 365 / Azure

Microsoft ecosystemself-service BIembedded analytics
CommercialLire plus

Metabase

Plateforme BI

Open Source

BI open-source pour le self-service rapide — les utilisateurs non techniques requêtent sans SQL

self-service BIquick deploymentnon-technical users

Apache Superset

Plateforme BI

Open Source

BI open-source flexible avec IDE SQL, visualisations riches et RBAC

open-source BISQL explorationcustom dashboards

Evidence

Plateforme BI

Open Source

BI code-first — rédigez des rapports en Markdown avec SQL, dashboards versionnés

code-first analyticsversion-controlled reportsdeveloper BI

Cube

Couche sémantique

EssayerOpen Source

Couche sémantique universelle — API REST/GraphQL/SQL, cache multi-niveaux, tout outil BI

semantic layermetric APIembedded analyticscaching

dbt Semantic Layer

Couche sémantique

EssayerOpen Source

Couche sémantique MetricFlow intégrée à dbt — métriques as code, source unique de vérité

metric definitionsdbt-centric stacksgoverned metrics
FreemiumLire plus

Kubernetes

Orchestration de conteneurs

Open Source

Le standard de l'orchestration de conteneurs — déclaratif, extensible, portable

container orchestrationmicroservicesauto-scalingplatform engineering

Amazon EKS

Orchestration de conteneurs

AWS

Kubernetes managé AWS — intégration profonde IAM/VPC, Fargate pour les pods serverless

AWS Kubernetesmanaged K8sFargate serverless
ManagéLire plus

Google GKE

Orchestration de conteneurs

GCP

Kubernetes managé GCP — mode Autopilot, mises à jour K8s les plus rapides

GCP Kubernetesautopilot podsmanaged K8s
ManagéLire plus

Terraform / OpenTofu

Infrastructure as Code

AdopterOpen Source

Le standard IaC — déclaratif, multi-cloud, écosystème de providers massif

infrastructure provisioningmulti-cloud IaCGitOps

Pulumi

Infrastructure as Code

Open Source

IaC avec de vrais langages de programmation (Python, TypeScript, Go) au lieu de HCL

IaCdeveloper-friendly infrastructuretesting IaC
FreemiumLire plus

Crossplane

Infrastructure as Code

Open Source

IaC natif Kubernetes — gérez les ressources cloud comme des custom resources K8s

K8s-native IaCplatform engineeringself-service infra

GitHub Actions

CI/CD

AdopterOpen Source

CI/CD intégré à GitHub — workflows YAML, marketplace massive, intégration OIDC

CI/CDGitHub-native automationOIDC auth to cloud
FreemiumLire plus

ArgoCD

CI/CD

Open Source

Livraison continue GitOps pour Kubernetes — déclaratif, auditable, auto-réparant

GitOpsK8s deploymentsdeclarative CD

Prometheus

Observabilité

Open Source

Collecte de métriques pull-based — le standard pour le monitoring Kubernetes

metrics collectionalertingK8s monitoring

Grafana

Observabilité

Open Source

La couche de visualisation pour l'observabilité — dashboards, alertes, multi-sources

metrics dashboardslog explorationalertingSRE tooling

OpenTelemetry

Observabilité

Open Source

Standard d'observabilité vendor-neutral — traces, métriques, logs avec un seul SDK

distributed tracingvendor-neutral observabilityinstrumentation

Datadog

Observabilité

Commercial

Observabilité commerciale complète — APM, logs, métriques, sécurité en une plateforme

full-stack observabilityAPMlog managementsecurity monitoring
CommercialLire plus

Backstage

Platform Engineering

Open Source

Portail développeur né chez Spotify — catalogue de services, templates, écosystème de plugins

developer portalservice catalogplatform engineering

OpenCost

FinOps

Open Source

Projet CNCF pour le monitoring des coûts Kubernetes — allocation temps réel, multi-cloud

K8s cost allocationFinOpsshowback/chargeback

HashiCorp Vault

Gestion des secrets

Open Source

Plateforme complète de gestion des secrets — secrets dynamiques, PKI, multi-cloud, ACL granulaire

secrets managementdynamic credentialsPKImulti-cloud
FreemiumLire plus

AWS Secrets Manager

Gestion des secrets

AWS

Secrets managés AWS avec rotation automatique via Lambda et intégration IAM

AWS secretsauto-rotationmanaged secrets
ManagéLire plus

Sigstore / Cosign

Sécurité de la chaîne logicielle

Open Source

Signature sans clé des conteneurs et artefacts — vérification de provenance, sans gestion de clés

container signingartifact verificationsupply chain security

Trivy

Scan de vulnérabilités

Open Source

Scanner de sécurité tout-en-un — conteneurs, systèmes de fichiers, IaC, génération SBOM

vulnerability scanningSBOM generationIaC scanning

Kyverno

Application de politiques

Open Source

Moteur de politiques natif Kubernetes — validation, mutation et génération de ressources en YAML

K8s admission controlpolicy enforcementimage verification

OPA / Gatekeeper

Application de politiques

Open Source

Moteur de politiques généraliste (Rego) — admission K8s, autorisation API, checks IaC

policy-as-codeK8s admissionauthorization

Python

Langage de programmation

AdopterOpen Source

Lingua franca du data engineering et du ML — pandas, PySpark, dbt, bibliothèques ML

data engineeringML/AIscriptingAPIs

SQL

Langage de requête

AdopterOpen Source

Irremplaçable pour l'analytique — chaque entrepôt, chaque outil BI, chaque rôle data

analyticsdata transformationdatabase querying

Polars

Bibliothèque DataFrame

AdopterOpen Source

Bibliothèque DataFrame propulsée par Rust — 10-100x plus rapide que pandas, évaluation lazy

data processingpandas replacementfast analytics

Apache Arrow

Format de données

EssayerOpen Source

Format colonnaire en mémoire — partage zero-copy entre systèmes, agnostique du langage

in-memory analyticscross-language data sharingcolumnar processing

PyTorch

Framework ML

Open Source

Framework dominant de deep learning — standard en recherche, production-ready avec TorchServe

deep learningmodel trainingresearchcomputer vision

Hugging Face

Plateforme ML

EU

Le GitHub du ML — hub de modèles, bibliothèque Transformers, datasets, Spaces pour les démos

model hubNLPfine-tuningmodel sharing

Rust (data tooling)

Langage de programmation

EssayerOpen Source

Propulse les outils data nouvelle génération — Polars, Delta-rs, DataFusion, chemins critiques en performance

performance-critical data toolssystems programming

Nous utilisons des cookies analytiques pour améliorer votre expérience. Aucune donnée personnelle n'est collectée.