git clone http://github.com/NikitaKolotushkin/AfTaPark.git
cd AfTaPark
python3 -m pip install virtualenv
virtualenv venv
source venv/bin/activate
pip install -r requirements.txt
import pandas as pd
import matplotlib.pyplot as plt
parquet_data = pd.read_parquet("C:\Alex\hachoton\part_2.parquet")
parquet_data.to_csv()
df2 = pd.read_csv("C:\Alex\hachoton\geo_dataframe.csv")
merged_df = pd.merge(parquet_data, df2, on='geo_id')
merged_df.to_csv('merged_file.csv', index=False)
region_counts = merged_df['region_id'].value_counts()
plt.figure(figsize=(10, 6))
plt.bar(region_counts.index, region_counts.values)
plt.xlabel('Region')
plt.ylabel('Number of Users')
plt.title('Distribution of Users by Region')
plt.xticks(rotation=45)
plt.show()
Пример кода отрисовки гистограммы на основе полученных статистических данных