개발일지0813
정렬의 종류 정렬이란 무작위로 나열된 자료를 특정 기준을 가지고 순차적으로 재배열하는 것을 의미한다. 이때 key라는 것이 존재하는데, 키는 자료를 정렬하는데 사용하는 기준이 되는 특정 값이 된다. 정렬은 정렬 장소에 따라 크게 내부정렬과 외부정렬로 나눌수가 있다. 외부정렬의 경우 메모리의 외부인 보조기억장치에서 정렬을 하는것이 특징이다. 보조기억장치에서 정렬을 하기 때문에 내부정렬보다 비교적 속도는 떨어지지만 대용량의 자료를 정렬하는 것이 가능하다. 대표적인 예로는 병합 방식을 이용한 정렬이 있다. 내부 정렬의 경우 메인 메모리에 올려서 빠르게, 비교적 적은 양의 데이터를 정렬하는 것이 특징입니다. 대표적인 예로는 앞으로 다룰 선택정렬, 버블정렬, 퀵 정렬, 삽입 정렬, 셸 정렬, 병합정렬, 히프 정렬..

개념 TF-IDF TF-IDF는 Term Frequency - Inverse Document Frequency 의 약자로써, 정보 검색과 텍스트 마이닝에서 이용하는 가중치이다. 여러 문서로 이루어진 문서들의 집합이 있을때, 어떤 단어가 특정 문서내에 얼머나 중요한지 추출해 내는 통계적 수치를 이용하여 문서의 추출하는데 이용된다. 또한 문서 들 간의 유사도를 판단하는 데 사용되기도 한다. TF-IDF의 값은 TF와 IDF 값을 곱한 값이다. TF 단어 빈도, term frequency, 는 특정 단어가 문서내에 얼마나 자주 등장하는지 나타내는 값이다. 값이 증가함에 따라 해당 단어의 중요도 또한 증가 한다고 해석 할 수 있다. tf(t,d) 로 표현하며 가장 단순한 방식은 다음과 같다. 그 외에는 빈도 계..
사실 소스트리 사용법 간단하게 라도 전부 다 작성 한 후에 오류에 대해서도 천천히 적고 싶었는데 해당 오류는 왜 지금 작성하냐면..... 작년쯤에도 비슷한 문제로 N시간을 삽질하며 고생했는데 한동안 안쓰다가 깃헙과 소스트리 연동 시켜서 다시 쓸라하다가 또 고생해서 미래의 내가 또 같은 실수 할 것같아서 정리합니다... 문제는 어디서 시작되었냐면 깃헙을 새로운 계정을 생성하면서 시작되었습니다. (.. ) 소스트리에는 구계정이 연결이 되어있었고, 소스트리 설정에 신계정을 연결 시켜뒀는데!! repository도 만들고 commit 까지 문제 없는데! 원격 저장소인 깃헙에 push 할라고 하니까 자꾸만 오류가 나는것. 처음에는 권한 문제 인줄 알고 이리 저리 뒤져보다가 결국 화나서 깃헙 구계정 아예 삭제 해버..