030_FirstModel_Regression - squeeze() führt zu Shape-Mismatch zwischen y_predict und y_tensor in der Trainingsschleife

**Beschreibung**
Im Code zu Kapitel 3 (030_FirstModel_Regression)  wird in `DataPrep.py` die Variable `y` mit doppelten eckigen Klammern erstellt, was ein 2D-Array der Form `[n_samples, 1]` erzeugt:
```python
y = np.array(anxiety_dummies[['Anxiety Level (1-10)']], dtype=np.float32)
```
Dadurch hat `y_tensor` die Form `[11000, 1]`.

In der Trainingsschleife in `10_ModelClass.py` wird nun `y_predict` gesqueezed:
```python
loss = loss_fn(y_predict.squeeze(), y_tensor)
```

Das führt zu einem Shape Mismatch: `y_predict.squeeze()` hat die Form `[11000]`, während `y_tensor` die Form `[11000,1]` beibehält. PyTorchs Boradcasting berechnet dann eine `[11000, 11000]`-Matrix statt 11.000 elementweiser Paare. Der MSE-Loss ist damit semantisch falsch.

**Lösung - Option A**: Beide Tensoren squeezen:
```python
loss = loss_fn(y_predict.squeeze(), y_tensor.squeeze())
```

**Lösung - Option B**: `y` direkt als 1D-Array in `DataPrep.py` anlegen
```python
y = np.array(anxiety_dummies['Anxiety Level (1-10)'], dtype=np.float32)
```

**Lösung - Option C**: `squeeze()` bei `y_predict` entfernen
```python
loss = loss_fn(y_predict, y_tensor)
```

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

030_FirstModel_Regression - squeeze() führt zu Shape-Mismatch zwischen y_predict und y_tensor in der Trainingsschleife #2

Metadata

Assignees

Labels

Type

Fields

Projects

Milestone

Relationships

Development

030_FirstModel_Regression - squeeze() führt zu Shape-Mismatch zwischen y_predict und y_tensor in der Trainingsschleife #2

Description

Metadata

Metadata

Assignees

Labels

Type

Fields

Projects

Milestone

Relationships

Development

Issue actions