5.1 파이썬(Python)과 빅데이터 소개

파이썬은 범용 프로그래밍 언어이다. 우리는 파이썬을 빅데이터(Big Data) 스트림에서 사용하는 프로그램을 만들기 위해 사용하고 있지만, 그 외에도 여러 응용프로그램에 사용되고 있으며, 웹 기반 어플리케이션에서 가장 인기 있는 언어이기도 하다. 파이썬은 1980년대 후반 네덜란드에 Guido van Rossum에 의해 개발되었고 현재 세 번째 버전까지 출시되었다.

 

NetLogo와 Blockly가 자신의 언어로 작성된 프로그램을 실행하기 위한 환경을 조성한 것처럼, 우리도 우리의 파이썬 프로그램을 위한 실행 환경을 조성해야 할 필요가 있다. 이 장에서는 파이썬 프로그램을 편집하고 실행시키기 위한 특정 시스템의 사용 방법을 볼 것이다.

 

파이썬은 텍스트형 프로그래밍 언어이다. NetLogo와 마찬가지로 파이썬으로 작성된 프로그램은 단순한 텍스트 행이다. 영어로 쓰여진 글(산문)이 영어 문법을 반드시 따르는 것처럼 해당 텍스트도 당연히 파이썬 문법 규칙을 반드시 따라야 한다. 이 장에서는 파이썬을 위한 문법 규칙을 알아볼 것이며, 문법을 틀렸을 때 어떤 결과를 보이는지도 함께 볼 것이다.

 

프로그래밍의 새로운 요소(파이썬 용어로는 모듈)에 대해서도 소개할 것이다. 모듈이란 다른 프로그램에도 사용될 수 있도록 재사용 가능한 컴포넌트의 집합이다. 모듈은 프로그래머가 새로운 프로그램을 만들 때 이미 있는 것을 다시 만드느라 쓸데없이 시간을 낭비하는 것(“reinventing the wheel”)을 피하는데 도움이 된다. 파이썬을 사용하는 프로그래머들의 커뮤니티 (카페)는 오디오, 데이터베이스, 게임 개발, 지리 정보 시스템, 영상 처리, 시각화를 위한 강력한 기능을 제공하는 많은 모듈을 만들었다. 빅데이터(Big Data) 스트림에 접근하기 위한 함수들도 모여져서 모듈이 되었다. 곧 빅데이터(BigData) 모듈을 사용하는 방법을 볼 것이며 이후에 시각화 라이브러리의 일부를 사용하는 방법도 볼 것이다.

 

이 책에서는 파이썬 공부를 하기 위한 2가지 방법을 제시한다. 첫 번째, 이전 장에서 우리는 컴퓨팅과 프로그래밍에 관한 지식을 학습했다. 그리고 반복의 기본 개념인 계산, 순서, 의사 결정은 우리에게 친숙한 기초 알고리즘 요소들이다. 또한 프로그램을 만들 때 중요한 기초 요소 중 하나인 함수에 대해서도 이미 알고 있다. 또한 우리는 이 알고리즘과 프로그램의 기초요소를 두 가지 프로그래밍 언어로 이미 보았다. 바로 NetLogo와 Blocky이다. 어쩌면 독자는 앞장에서 Blockly에서 생성된 파이썬 코드를 보면서 미리 파이썬을 예습했을 수도 있다. 두 번째, 우리는 파이썬을 빅데이터(Big Data) 애플리케이션에 대하여 사용하는 것에 초점을 맞췄다. 파이썬의 일부 요소는 빅데이터 작업에 필수적이며 우리는 이 언어 요소에 집중할 것이다.

 

이번 장에서는 파이썬에 대해 이미 알고 있는 것을 최대한 적게 복습하며 빅데이터 프로그래밍을 위한 필수적인 파이썬 요소를 학습하는 것에 중점을 둘 것이다. 이것을 읽는 독자들이 초심자가 아닌 만큼 이 장은 ‘파이썬 초심자를 위한 가이드’가 되지 않을 것이다. 따라서 파이썬에 대한 세부 내용들은 넘어가거나, 간단하게만 다룰 것이다. 이 장에서 설명이 부족한 파이썬에 대한 자세한 내용들은 온라인 링크를 통해 참조할 수 있다. 그리고 프로그래밍 언어는 항상 업데이트가 되기 때문에 스스로 프로그래밍 언어에 대한 세부적인 것을 찾을 수 있는 능력이 필요하다.

Leave a Reply

Your email address will not be published. Required fields are marked *

*