Fisher’s exact test

독립변수와 종속변수가 모두 범주형 변수라면 어떤 통계분석을 적용시킬 수 있을까? 이 질문에 맞는 분석은 교차표 분석이다. 여기서 독립변수는 연구자가 의도적으로 변화시키는 변수이고, 종속변수는 독립변수의 변화에 의해서 변화하는 변수를 지칭한다. 교차표 분석을 통해 설정 방법에 따라 여러가지 분석을 적용시킬 수가 있는데 대표적인 방법으로 카이제곱 및 피셔 정확도 검정이 있다.

Read More

about bootstrapping

어떤 데이터의 평균을 구하는 문제를 생각해 보자. 보통 이런 문제의 목적은 그 데이터를 생산한 대상이 앞으로 생산할 데이터가 무엇일지 예상하는 것이다. 예를 들면 지구의 평균 온도는 무엇인가와 같은 질문에 답을 하기 위해서는 몇년간의 데이터가 필요할것이다. 하지만, 여름철에만 측정한 온도만을 이용한다면, 지구의 평균온도를 정확히 추정할 수 없을 것이다. 그러므로 상황에 따른 데이터가용성의 변화에 대해서 고려할 필요가 있다.

Read More

Kalman filter

low-pass filter, high-pass filter 등의 보통 필터의 가정은 노이즈의 주파수 영역을 알고 있다는 것이다. 하지만, 노이즈는 모든 주파수 영역을 가지기 때문에 보통의 필터는 노이즈만을 완전히 분리하는데 한계가 있다. 또한 노이즈를 분리하는 과정에서 필연적으로 신호의 손실을 가져오게 된다.

Read More

What is the expectation maximization algorithm?

만약 통계 모델이 관측되지 않은 변수에 종속적이라면 모델의 파라미터는 어떻게 구해야 할까? EM 알고리즘은 데이터셋으로부터 얻는 정보가 불완전할 때, 모델의 파라미터를 추정하는 iterative algortithm으로써 Expectation(E) 단계와 Maximizing(M) 단계로 구성된다.

Read More

Generative and discriminative models

패턴 인식분야에서 분류에 쓰이는 모델은 크게 두가지로 분류될 수 있는데, 이들은 각각 Generative Model(생성 모델)과 Discriminative Model(판별 모델)입니다. 이 둘은 어떤 차이가 있을까요?

Read More

How to make JAR file executable in linux

JAR는 자바 아카이브(Java ARchive)로써, 자바클레스, 연관된 메타데이터, 텍스트/이미지 등의 리소스들을 하나의 파일로 모으기 위해서 전형적으로 사용하는 일종의 패키지 파일 형식입니다. JAR파일로 패키징을 하는 이유는 자바플랫폼에서 실행되는 응용프로그램 및 관련라이브러리를 패키징하여 배포하기 위함입니다. JAR은 근본적으로 아카이브 파일인데 .zip이나 .jar파일 확장자를 가질수 있습니다. 여기서는 그러한 JAR파일을 실행이 가능한 형태로 바꾸는 방법을 설명합니다.

Read More

The extraordinary link between deep neural networks and the nature of the universe

복잡한 문제들을 푸는데 딥뉴럴넷이 왜 그렇게 좋은 성능을 보일 수 있을까요? 최근, 물리학자들은 물리적 법칙에서 그 비밀을 찾았습니다. 지난 몇 년 동안, 딥러닝 기술은 인공지능 분야를 변화시켜 왔습니다. 하나씩 하나씩, 인간이 자신의 고유한 능력과 기술이라고 생각해 왔던 여러가지 것들이 강력해진 기계들의 맹공격을 받기 시작하였습니다. 얼굴 인식 및 물체 인식과 같은 작업에서 딥뉴럴넷은 인간보다 뛰어납니다. 그들은 고대부터 전해져온 바둑을 마스터하였고 최고의 인간 플레이어를 제압했습니다.

Read More

Understanding LSTM Networks

LSTM (Long Short-Term Memory)네트워크에 관한 이 문서의 원문은 여기에서 확인할 수 있습니다. LSTM 네트워크의 이해에 도움이 되는 좋은 내용이라 생각되어 꼼꼼히 읽어보고자 번역합니다.

Read More

Quick Start Guide for HDF5 in python

HDF(Hierarchical Data Format)는 대용량 데이터를 저장하고 구성하기 위해 고안된 일련의 파일 형식 (HDF4, HDF5)입니다. 빅데이터 분석의 중요성이 부각되는 요즘, HDF는 점점더 인기있는 파일 형식이 되고 있습니다. 이 글은 파이썬에서 HDF5의 사용방법을 설명하는 간단한 예제입니다. 영문으로 된 원문은 여기를 보시기 바랍니다.

Read More