교육 · Cloudera Open Source

Cloudera 교육

Cloudera Data Platform을 구성하는 핵심 오픈소스 — Apache NiFi · Kafka · Impala · Kudu — 에 대한 실습 중심의 심화 과정을 제공합니다. 현장 엔지니어가 바로 적용할 수 있는 운영·개발·튜닝 노하우를 전달합니다.

커리큘럼 개요

4개 오픈소스 프로젝트 각각에 대해 아키텍처부터 운영 최적화까지 엔드투엔드로 다루며, 실제 운영 현장에서 축적된 베스트 프랙티스를 바탕으로 구성되어 있습니다.

01
데이터 플로우 관리의 표준

Apache NiFi

엔터프라이즈 데이터 수집·변환·전달을 위한 Apache NiFi 전반을 다룹니다. 아키텍처부터 DataFlow 설계, 운영 최적화, 프로세서 확장까지 포함합니다.

Curriculum

19 topics
  • 01데이터 파이프라인 아키텍처
  • 02NiFi가 제공하는 주요 기능
  • 03NiFi 주요 컴포넌트
  • 04NiFi의 중요한 개념
  • 05NiFi Processor
  • 06FlowFile의 구조
  • 07Relationship
  • 08Yield, Penalize, Rollback, Commit
  • 09Scheduling
  • 10Process Group
  • 11Queue
  • 12Funnel
  • 13Data Provenance
  • 14Site-To-Site
  • 15Controller Service
  • 16NiFi Processor 사용법
  • 17NiFi Processor 개발 및 확장
  • 18NiFi 운영 및 최적화
  • 19NiFi DataFlow 실제 설계 방법
02
분산 스트리밍 플랫폼

Apache Kafka

Apache Kafka의 설치부터 내부 구조, 프로듀서/컨슈머 동작, 미러링, 운영·모니터링까지 실무 전반을 학습합니다.

Curriculum

12 topics
  • 01Kafka 소개
  • 02Kafka 설치
  • 03Kafka 메시지 송신
  • 04Kafka 메시지 수신
  • 05Kafka 내부 구조
  • 06Topic과 Partition
  • 07메시지의 전달
  • 08Kafka Connector
  • 09Kafka 미러링
  • 10Kafka 관리
  • 11Kafka 모니터링
  • 12Kafka 운영 설정
03
고성능 MPP SQL 엔진

Apache Impala

Impala 아키텍처와 설치/구성 요구사항부터 Iceberg 통합, 쿼리 프로파일 분석, 성능 튜닝, 보안 설정까지 다룹니다.

Curriculum

16 topics
  • 01Impala 소개
  • 02Impala 아키텍처
  • 03Impala 설치 및 구성을 위한 요구사항
  • 04Impala의 주요 포트
  • 05Impala Data Type
  • 06Impala Client Access
  • 07Impala Coordinator
  • 08Impala Catalog & StateStore
  • 09지원하는 파일 포맷 및 스토리지
  • 10Iceberg Integration
  • 11Impala Query Profile
  • 12Impala 시스템 모니터링
  • 13Admission Control
  • 14Performance Tuning
  • 15Impala Security
  • 16HBase Integration
04
빠른 분석형 컬럼 저장소

Apache Kudu

Kudu의 포지셔닝과 아키텍처, 스키마 설계, Impala 연동, API 사용법, 보안 및 관리 CLI까지 실습과 함께 학습합니다.

Curriculum

9 topics
  • 01Kudu 소개
  • 02Kudu의 포지션
  • 03Kudu 아키텍처
  • 04Kudu 스키마 설계
  • 05Impala와 Kudu
  • 06Impala와 Hive
  • 07Kudu API
  • 08Kudu Security
  • 09Kudu Command Line
교육 · Cloudera Open Source
문의하기