티스토리 뷰

카테고리 없음

Madrid pop_structure_visual_with_pandas.py

패스트코드블로그 2021. 7. 28. 17:21

 

17:

csv reader 는 1회 이상 사용하면 GC 가 제거한다
19:

17번의 문제점을 해결하기 위해, 다시 list() 함수를 통해 자료구조에 저장한다.

49:

mn 은 minimum 값으로 , for loop 에서 현재 값보다 작은 값이 나오면 교체된다.

최초값은 1부터 시작하여 소수점 이하로 내려간다. 두개의 차트사이의 값의 차이를 cost 라고 하는데,

가장 비슷한 지역은 cost 가 최소값인 지역이다. 이것을 판단하기 위해 mn 을 사용한다.

55:

home 은 local  variable로 global 값인 self.home 을 대신하지 않는다. 

i[3:] 은 202106__0세 ~ 202106__100세 이상 을 의미한다. 즉 연령별 인구수이다.

i[2] 는 202106__연령구간인구수 이다. 

np.array(i[3:], dtype=int)/int(i[2]) 식은 전체 연령별 인구수의 합에서 각 연령층의 비율이 된다.

기존에 정의되었던 self.home 을 local variable home 으로 변경해야 한다.

왜냐하면 기존의 홈지역만 출력하는 것이 아니라, 유사도가 있는 두 지역을 출력하기 때문이다.

 

 

댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/01   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함