Skip to content

Commit 833208f

Browse files
committed
Add CS version of the case study
1 parent 09af9f2 commit 833208f

3 files changed

Lines changed: 2222 additions & 6 deletions

File tree

content/titanic/CaseStudy.cs.md

Lines changed: 4 additions & 4 deletions
Original file line numberDiff line numberDiff line change
@@ -141,7 +141,7 @@ plt.show()
141141
#počet přeživších
142142
f,ax=plt.subplots(figsize=(5,5))
143143
survivd_counts = df_titanic.Survived.value_counts()
144-
přežil_počet.plot.bar(ax=ax)
144+
survivd_counts.plot.bar(ax=ax)
145145
ax.set_title('Zahynulí vs. přežili')
146146
plt.show()
147147
#Procento přeživších
@@ -195,7 +195,7 @@ Histogram lze udělat několika způsoby. Ukážeme si 3 způsoby.
195195
- pd.Sereis.hist(): nejjednodušší a standardně zvládne NaN
196196
##### Úkol 10: Vykreslete histogram pro věk
197197
Použijte funkci pandas Series hist(), která zpracovává chybějící hodnotu.
198-
#use dataframe hist(), který bude standardně zpracovávat NaN
198+
# použít dataframe hist(), který bude standardně zpracovávat NaN
199199
obr, ax = plt.subplots()
200200
df_titanic.Age.hist(ax=ax, bins=20, edgecolor='black', alpha=0.5)
201201
##### Úkol 11: Naskládejte věkový histogram přežitých na vrchol celkového věkového histogramu
@@ -220,7 +220,7 @@ Předvedeme si plnění průměrem/režimem a odhadem z dalších sloupců.
220220
#### Vyplňte průměrem/režimem
221221
Embarked má pouze 2 chybějící hodnoty a neexistuje žádný zřejmý způsob, jak odhadnout chybějící hodnotu, jednoduše ji doplníme režimem sloupce nebo 'S'
222222
##### Úkol 12: Doplňte chybějící Nastoupili jste s režimem
223-
#fill NaN v režimu Embarked with
223+
# fill NaN v režimu Embarked with
224224
df_titanic['Embarked'].fillna(df_titanic.Embarked.mode()[0],inplace=True)
225225
df_titanic.info()
226226
#### Vyplňte odhadovanou hodnotou
@@ -232,7 +232,7 @@ Pokud se podíváme na všechna jména cestujících Titaniku, vidíme, že jmé
232232
- Nejprve použijeme regulární výraz k extrahování názvu z názvu.
233233
- Poté převedeme název na velká písmena.
234234
- Chybějící věk pak doplníme průměrným věkem konkrétního titulu.
235-
#extrahujte předponu z názvu
235+
# extrahujte předponu z názvu
236236
df_titanic['Title']=df_titanic.Name.str.extract('([A-Za-z]+\.)')
237237
df_titanic.head()
238238
##### Úkol 13: převeďte počáteční písmena na velká písmena.

content/titanic/CaseStudy_Titanic-Solution.ipynb

Lines changed: 2 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -708,7 +708,7 @@
708708
"\n",
709709
"Categorical Features in the dataset: Sex,Embarked.\n",
710710
"\n",
711-
"##### Continous Feature:\n",
711+
"##### Continuous Feature:\n",
712712
"A feature is said to be continous if it can take values between any two points or between the minimum or maximum values in the features column.\n",
713713
"\n",
714714
"Continous Features in the dataset: Fare"
@@ -2061,7 +2061,7 @@
20612061
"cell_type": "markdown",
20622062
"metadata": {},
20632063
"source": [
2064-
"##### Task16: Contruct a regresson on Fare\n",
2064+
"##### Task16: Construct a regression on Fare\n",
20652065
"Construct regression model with statsmodels.\n",
20662066
"\n",
20672067
"Pick Pclass, Embarked, FamilySize as independent variables."

0 commit comments

Comments
 (0)