Přehledy nástrojů & technologií

Nástroje

Kurátorované přehledy databází, frameworků, nástrojů a platforem pro práci s daty.

Databáze

🐘

PostgreSQL

Open-source relační databáze s pokročilými funkcemi, ACID garancemi a bohatým ekosystémem extensions.

  • JSONB pro semi-strukturovaná data
  • Full-text search a GIS podpora
  • Partitioning a parallel queries
  • Logical replication
📦

MongoDB

Document-oriented NoSQL databáze ideální pro flexibilní schémata a horizontální škálování.

  • Flexibilní BSON dokumenty
  • Aggregation pipeline framework
  • Sharding pro distribuci dat
  • Atlas managed service

ClickHouse

Column-oriented OLAP databáze pro real-time analytics s extrémně vysokým výkonem.

  • Vektorizované zpracování dotazů
  • Vysoká komprese dat (10-100x)
  • Distributed queries
  • Real-time data ingestion
🔴

Redis

In-memory data structure store používaný jako cache, message broker a session store.

  • Sub-milisekundová latence
  • Pub/Sub messaging
  • Persistence options (RDB, AOF)
  • Clustering a replication
🌐

Cassandra

Distribuovaná NoSQL databáze designovaná pro high availability bez single point of failure.

  • Linear scalability
  • Multi-datacenter replication
  • Tunable consistency
  • CQL query language
⏱️

TimescaleDB

PostgreSQL extension optimalizovaná pro time-series data s plnou SQL kompatibilitou.

  • Automatické partitioning
  • Continuous aggregates
  • Data retention policies
  • PostgreSQL ecosystem

Stream Processing

🚀

Apache Kafka

Distribuovaný streaming platform pro building real-time data pipelines a streaming aplikací.

  • High-throughput pub/sub
  • Durable message storage
  • Kafka Streams & Connect
  • Exactly-once semantics
⚙️

Apache Flink

Stateful computations over data streams s podporou event time processing.

  • Low-latency stream processing
  • Event time semantics
  • Exactly-once state consistency
  • SQL API pro stream queries

Apache Spark

Unified analytics engine pro batch a stream processing s MLlib a GraphX.

  • In-memory computing
  • Structured Streaming
  • MLlib machine learning
  • Multi-language API

Vizualizační nástroje

📊

Grafana

Open-source analytics & monitoring platform s podporou mnoha data sources.

  • Real-time dashboards
  • Alerting system
  • Plugin ecosystem
  • Multi-datasource support
📈

Apache Superset

Modern data exploration & visualization platform pro business intelligence.

  • SQL Lab pro ad-hoc queries
  • Rich visualization library
  • Semantic layer
  • Role-based access control
🎨

Metabase

User-friendly BI tool pro vytváření dashboardů bez nutnosti SQL znalostí.

  • Visual query builder
  • Embedded analytics
  • Email scheduling
  • Easy setup