-
Notifications
You must be signed in to change notification settings - Fork 0
Expand file tree
/
Copy pathplot.py
More file actions
94 lines (78 loc) · 1.97 KB
/
plot.py
File metadata and controls
94 lines (78 loc) · 1.97 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
import pandas as pd
import matplotlib.pyplot as plt
#Semplici grafici per analizzare il problema. Dato che la maggior parte
#dei dati contiene valori discreti appartenenti ad insieme relativamente piccoli,
#non è stata data una particolare rilevanza a questa fase.
#In ogni caso, lo studio della distribuzione relativa alla tariffa di viaggio
#può portare ad una migliore divisione in intervalli discreti di tale dato.
df = pd.read_csv("train.csv")
#costo biglietto
df.sort_values(by="Fare", ascending=True, inplace=True)
s = df['Fare']
t = []
for x in s:
t.append(x)
plt.plot(t)
plt.ylabel('some numbers')
plt.title("costo biglietto")
plt.show()
plt.hist(t, 400)
plt.title("Distribuzione costo biglietto")
plt.show()
#sopravissuti
f_df = df[ df['Sex'] == "female"]
m_df = df[ df['Sex'] == "male"]
f_n = f_df['Sex']
tot_s = []
for x in f_n:
tot_s.append(1)
m_n = m_df['Sex']
for x in m_n:
tot_s.append(0)
f = f_df['Survived']
f_list = []
for x in f:
f_list.append(x)
m = m_df['Survived']
m_list = []
for x in m:
m_list.append(x)
plt.figure(figsize=(9, 5))
plt.subplot(131)
plt.gca().set_title('Rapporto uomo/donna')
plt.hist(tot_s, 3)
plt.subplot(132)
plt.gca().set_title('Sopravissute(=1) donne')
plt.hist(f_list, 3)
plt.subplot(133)
plt.gca().set_title('Sopravissuti(=1) uomini')
plt.hist(m_list, 3)
plt.suptitle('Sopravissuti in base al sesso')
plt.show()
c1_df = df[ df["Pclass"] == 1]
c1 = c1_df['Survived']
c1_list = []
for x in c1:
c1_list.append(x)
c2_df = df[ df["Pclass"] == 2]
c2 = c2_df['Survived']
c2_list = []
for x in c2:
c2_list.append(x)
c3_df = df[ df["Pclass"] == 3]
c3 = c3_df['Survived']
c3_list = []
for x in c3:
c3_list.append(x)
plt.figure(figsize=(9, 5))
plt.subplot(131)
plt.gca().set_title('Prima classe')
plt.hist(c1_list, 3)
plt.subplot(132)
plt.gca().set_title('Seconda classe')
plt.hist(c2_list, 3)
plt.subplot(133)
plt.gca().set_title('Terza classe')
plt.hist(c3_list, 3)
plt.suptitle('Sopravissuti(=1) in base alla classe')
plt.show()