티스토리 뷰

5. 파이썬

머신러닝/--/하마/ 타이타닉 컬럼 (Feature)

패스트코드블로그 2020. 9. 23. 09:54

www.kaggle.com/c/titanic/data

Data Dictionary ===> variable = feature = parameter = axis 

Variable    Definition  Key

0. survival Survival    0 = No, 1 = Yes

1. pclass   Ticket class    1 = 1st, 2 = 2nd, 3 = 3rd

2. sex  Sex 

3. Age  Age in years    

4. sibsp    # of siblings / spouses aboard the Titanic  

5. parch    # of parents / children aboard the Titanic  

6. ticket   Ticket number   

7. fare Passenger fare  

8. cabin    Cabin number    

9. embarked Port of Embarkation C = Cherbourg, Q = Queenstown, S = Southampton



Variable Notes

pclass: A proxy for socio-economic status (SES)

1st = Upper

2nd = Middle

3rd = Lower

 

age: Age is fractional if less than 1. If the age is estimated, is it in the form of xx.5

 

sibsp: The dataset defines family relations in this way...

Sibling = brother, sister, stepbrother, stepsister

Spouse = husband, wife (mistresses and fiancés were ignored)

 

parch: The dataset defines family relations in this way...

Parent = mother, father

Child = daughter, son, stepdaughter, stepson

Some children travelled only with a nanny, therefore parch=0 for them.

댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/12   »
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31
글 보관함