test 4

Python Programming

Python Programming Python Programming 의 경우에는 실무적용이 바로 가능하도록 안내및, 실습 테스트를 하여 바로 진행 하겠습니다.기본적인 설명을 건너뛰고, 실습적용 단계 로그 추출및, 로그 데이터 백업등의 간단한 부분부터 시작하도록 하겠습니다. 저 또한, 지속적으로 미루어 왔던 부분인지라 같이 배우면서 테스트가 되었으면 좋겠습니다.

Apache Spark

Spark의 중심에는 RDD(Resilient Distributed Dataset, 회복성 있는 분산 데이터 세트) 개념이 있다. 이는 YARN 클러스터의 여러 물리적 노드에서 나뉘고 분산되었으며, 병렬적으로 작동될 수 있는 객체들의 변경 불가능한 집합을 뜻한다.주로 RDD은 공유된 파일 시스템, HDFS, HBase 혹은 YARN 클러스터에 하둡 InputFormat을 제공하는 데이터 소스에서 데이터를 로드할 때 인스턴스화된다.RDD가 실체화 되면, 사용자는 일련의 연산을 적용할 수 있다. 모든 연산은 변형이나 동작 중 하나의 유형으로 나뉜다. 이름이 뜻하듯이 변형 (Transformation) 연산은 기존의RDD에서 새로운 데이터 세트를 생성하고 YARN 클러스터의 분할된 데이터 세트에 적용될 수 있..

Varnish cache

Varnish 소개Varnish는 BSD 라이선스를 따르는 오픈 소스 웹 캐시 소프트웨어이다. Varnish는 2006년 노르웨이의 최대 신문사인 Verdens Gang(VG)에서 사용하기 위해 개발되기 시작했으며, 유명한 FreeBSD의 커널 개발자인 Poul-Henning Kamp(PHK)가 개발을 주도했다. PHK는 OS 커널에 대한 해박한 지식을 바탕으로, Varnish가 OS 커널과 조화롭게 동작하여 최적의 성능을 발휘할 수 있도록 설계했다. Varnish가 개발된 후, VG는 기존에 사용하던 12대의 Squid 서버를 3대의 Varnish 서버로 교체했다. 현재는 Varnish Software(www.varnish-software.com)가 Varnish를 개발하고 있으며, Varnish에 대..