Analiza danych hydrochemicznych jezior

📌 Opis

Repozytorium zawiera kompletny zestaw skryptów w Pythonie (1.py … 14.py) służących do analizy jakości wód (inflow/outflow) na podstawie danych środowiskowych.
Celem projektu jest:

eksploracja i przygotowanie danych,
testy statystyczne i korelacje,
redukcja wymiarowości (PCA),
grupowanie obserwacji (klasteryzacja KMeans),
modelowanie jakości wody (Random Forest),
interpretacja wyników za pomocą analiz ważności cech i wykresów zależności częściowych.

📂 Struktura plików

1.py – statystyki opisowe (średnie, min, max, odchylenia standardowe) dla inflow/outflow
2.py – testy statystyczne (t-Student, Mann–Whitney U) dla zmiennych numerycznych
3.py – wizualizacja wyników testów, boxploty i wykresy porównawcze
4.py – identyfikacja silnych korelacji pomiędzy zmiennymi (|r| > 0.7)
5.py – test liniowości zależności i funkcja test_linearity
6.py – macierze korelacji Spearmana (dla inflow i outflow) + heatmapy
7.py – regresje nieliniowe (LOWESS) dla silnie skorelowanych par zmiennych
8.py – PCA (redukcja do 2D i 3D) + standaryzacja danych
9.py – analiza ładunków PCA (zmienne o największym wpływie na PC1 i PC2)
10.py – klasteryzacja KMeans + wybór liczby klastrów metodą silhouette score
11.py – preprocessing: wczytywanie danych z CSV, konwersja dat, przygotowanie PCA i klastrów
12.py – model Random Forest do predykcji zmiennej DO (rozpuszczony tlen)
13.py – poprawiony model RF (bez użycia DO jako predyktora), ewaluacja na zbiorze testowym
14.py – końcowe modelowanie: Random Forest + interpretacja (Permutation Importance, PDP)

⚙️ Wymagania

Python 3.9+
Zależności:
- pandas, numpy
- scipy, statsmodels
- matplotlib, seaborn
- scikit-learn
- dateutil
- (opcjonalnie) ace_tools

Instalacja:

pip install -r requirements.txt

▶️ Uruchamianie

Każdy etap można uruchamiać oddzielnie:

python 1.py
python 2.py
...
python 14.py

Rekomendowana jest praca w środowisku Jupyter/Colab, gdzie wyniki są prezentowane jako wykresy i tabele.

Wyniki

Projekt dostarcza:

statystyk opisowych dla danych inflow/outflow,
wyników testów statystycznych i analiz korelacji,
wizualizacji PCA i klasteryzacji KMeans,
modelu predykcyjnego jakości wody (Random Forest),
interpretacji istotności cech (Permutation Importance, PDP).

👩‍💻 Autorzy

Klaudia Levita
Tymoteusz Miller (wsparcie merytoryczne)

📄 Licencja

MIT License – szczegóły w pliku LICENSE.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Analiza danych hydrochemicznych jezior

📌 Opis

📂 Struktura plików

⚙️ Wymagania

▶️ Uruchamianie

Wyniki

👩‍💻 Autorzy

📄 Licencja

About

Uh oh!

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
1.py		1.py
10.py		10.py
11.py		11.py
12.py		12.py
13.py		13.py
14.py		14.py
2.py		2.py
3.py		3.py
4.py		4.py
5.py		5.py
6.py		6.py
7.py		7.py
8.py		8.py
9.py		9.py
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt

License

Lewwita/Magisterka

Folders and files

Latest commit

History

Repository files navigation

Analiza danych hydrochemicznych jezior

📌 Opis

📂 Struktura plików

⚙️ Wymagania

▶️ Uruchamianie

Wyniki

👩‍💻 Autorzy

📄 Licencja

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages