Git Product home page Git Product logo

car_accident_prediction's Introduction

Проект "Оценка риска ДТП по маршруту движения каршеринга"

Описание проекта

Заказ поступил от каршеринговой компании. Необходимо создать систему для оценки риска возникновения ДТП по маршруту движения. Если уровень риска высокий, то будет дано уведомление водителю и рекомендации по изменению маршруту движения.

Таблицы

case_ids (индексы происшествий)

parties (описание участников происшествия)

  • case_id (уникальный номер зарегистрированного происшествия в таблице происшествий);
  • party_number (номер участника происшествия) - от 1 до N: по числу участников происшествия;
  • party_type (тип участника происшествия):
    • 1 - Car (Авто);
    • 2 - Road bumper (Дорожные знаки);
    • 3 - Building (Строения);
    • 4 - Road signs (Отбойник);
    • 5 - Other (Другое);
    • 6 - Operator (Оператор);
    • _ - Not Stated (Не указано).
  • at_fault (виновность участника) - 0 или 1;
  • insurance_premium (сумма страховки);
  • party_drug_physical (состояние чуастника: физическое или с учетом принятых лекарств):
    • E - Under Drug Influence (Под воздействием лекарств);
    • F - Impairment Physical (Ухудшение состояния);
    • G - Impairment Unknown (Не известно);
    • H - Not Applicable (Не оценивался);
    • I - Sleepy / Fatigued (Сонный / усталый);
    • _ - Not Stated (Не указано).
  • party_sobriety (трезвость участника):
    • A - Had Not Been Drinking (Не пил);
    • B - Had Been Drinking, Under Influence (Был пьян, под влиянием);
    • C - Had Been Drinking, Not Under Influence (Был пьян, не под влиянием);
    • D - Had Been Drinking, Impairment Unknown (Был пьян, ухудшение неизвестно);
    • G - Impairment Unknown (Неизвестно ухудшение);
    • H - Not Applicable (Не оценивался);
    • _ - Not Stated (Не указано).
  • cellphone_in_use (наличие телефона в автомобиле) - 0 или

vehicles (описание автомобиля)

  • id (индекс текущей таблицы);
  • case_id (идентификационный номер в базе данных);
  • vehicle_type (тип кузова):
    • MINIVAN;
    • COUPE;
    • SEDAN;
    • HATCHBACK;
    • OTHER.
  • vehicle_transmission (тип КПП):
    • auto (Автоматическая).
    • manual (Ручная).
    • _ - Not Stated (Не указано)
  • vehicle_age (возраст автомобиля).

collisions (информация о происшествия)

  • case_id (идентификационный номер в базе данных);
  • collision_date (дата происшествия);
  • collision_time (время происшествия);
  • intersection (является ли место происшествия перекрестком):
    • Y — Intersection (перекрёсток);
    • N — Not Intersection (не перекрёсток);
    • _ Not stated (Не указано).
  • weather_1 (погода):
    • A — Clear (Ясно);
    • B — Cloudy (Облачно);
    • C — Raining (Дождь);
    • D — Snowing (Снегопад);
    • E — Fog (Туман);
    • F — Other (Другое);
    • G — Wind (Ветер);
  • collision_damage (серьезность происшествия):
    • Fatal TC (Не подлежит восстановлению);
    • Severe Damage (Серьезное повреждение);
    • Middle Damage (Машина в целом на ходу);
    • Small Damage (Отдельный элемент под замену / покраску);
    • Scratch (Царапина).
  • primary_collision_factor (основной фактор аварии):
    • A - Code Violation (Нарушение правил ПДД);
    • B - Other Improper Driving (Другое неправильное вождение);
    • C - Other Than Driver (Кроме водителя);
    • D - Unknown (Неизвестно);
    • E - Fell Asleep (Заснул);
    • _ - Not Stated (Не указано).
  • road_surface (состояние дороги):
    • A — Dry (Сухая);
    • B — Wet (Мокрая);
    • C — Snowy or Icy (Заснеженная или обледенелая);
    • D — Slippery (Muddy, Oily, etc.) (Скользкая, грязная, маслянистая и т. д.);
    • _ Not Stated (Не указано).
  • lightning (освещение):
    • A — Daylight (Дневной свет);
    • B — Dusk-Dawn (Сумерки-Рассвет);
    • C — Dark-Street Lights (Темно-Уличные фонари);
    • D — Dark-No Street Lights (Темно-Нет уличных фонарей);
    • E — Dark-Street Lights Not Functioning (Темно-Уличные фонари не работают);
    • _ Not Stated (Не указано).
  • county_city_location (номер географических районов, где произошло ДТП);
  • county_location (названия географических районов, где произошло ДТП);
  • direction (направление движения):
    • N — North (Север)
    • E — East (Восток)
    • S — South (Юг)
    • W — West (Запад)
    • _ — Not State (Не указано)
    • на перекрёстке
  • distance (расстояние до главной дороги в метрах);
  • location_type (тип дороги):
    • H — Highway (Шоссе);
    • I — Intersection (Перекрёсток);
    • R — Ramp (or Collector) (Рампа);
    • _ — Not State Highway (Не указано).
  • party_count (количество участников);
  • pcf_violation_category (категория нарушения):
    • 01 - Driving Under the Influence of Alcohol or Drug - Вождение или езда в состоянии алкогольного или наркотического опьянения;
    • 02 - Impeding Traffic - Препятствие движению транспорта;
    • 03 - Unsafe Speed - Превышение скорости;
    • 04 - Following Too Closely - Опасное сближение;
    • 05 - Wrong Side of Road - Неправильная сторона дороги;
    • 06 — Improper Passing - Неправильное движение;
    • 07 — Unsafe Lane Change - Небезопасная смена полосы движения;
    • 08 — Improper Turning - Неправильный поворот;
    • 09 — Automobile Right of Way - Автомобильное право проезда;
    • 10 — Pedestrian Right of Way - Пешеходное право проезда;
    • 11 — Pedestrian Violation - Нарушение пешеходами;
    • 12 — Traffic Signals and Signs - Дорожные сигналы и знаки;
    • 13 — Hazardous Parking - Неправильная парковка;
    • 14 — Lights - Освещение;
    • 15 — Brakes - Тормоза;
    • 16 — Other Equipment - Другое оборудование;
    • 17 — Other Hazardous Violation - Другие нарушения;
    • 18 — Other Than Driver (or Pedestrian) - Кроме водителя или пешехода;
    • 19 — Speeding - Скорость;
    • 20 — Pedestrian dui - Нарушение пешехода;
    • 21 — Unsafe Starting or Backing - Опасный старт;
    • 22 — Other Improper Driving - Другое неправильное вождение;
    • 23 — Pedestrian or “Other” Under the Influence of Alcohol or Drug - Пешеход или «Другой» в состоянии алкогольного или наркотического опьянения;
    • 24 — Fell Asleep - Заснул;
    • 00 — Unknown - Неизвестно;
    • _ - Not Stated - Не указано.
  • type_of_collision (тип аварии):
    • A — Head-On (Лоб в лоб);
    • B — Sideswipe (Сторона);
    • C — Rear End (Столкновение задней частью);
    • D — Broadside (Боковой удар);
    • E — Hit Object (Удар объекта);
    • F — Overturned (Опрокинутый);
    • G — Vehicle (транспортное средство/ Пешеход);
    • H — Other (Другое);
    • _ - Not Stated (Не указано).
  • motor_vehicle_involved_with (дополнительные участники ДТП):
    • Other motor vehicle (Другой автомобиль);
    • Fixed object (Неподвижный объект);
    • Parked motor vehicle (Припаркованный автомобиль);
    • Pedestrian (Пешеход);
    • Bicycle (Велосипедист);
    • Non-collision (Не столкновение);
    • Other object (Другой объект);
    • Motor vehicle on other roadway (Автомобиль на другой проезжей);
    • Animal (Животное);
    • Train (Поезд).
  • road_condition_1 (дорожное состояние):
    • A — Holes, Deep Ruts (Ямы, глубокая колея);
    • B — Loose Material on Roadway (Сыпучий материал на проезжей части);
    • C — Obstruction on Roadway (Препятствие на проезжей части);
    • D — Construction or Repair Zone (Зона строительства или ремонта);
    • E — Reduced Roadway Width (Уменьшенная ширина проезжей части);
    • F — Flooded (Затоплено);
    • G — Other (Другое);
    • H — No Unusual Condition (Нет ничего необычного);
    • _ — Not Stated (Не указано).
  • control_device (устройство управления):
    • A — Functioning (Функционирует);
    • B — Not Functioning (Не функционирует);
    • C — Obscured (Затемнённый);
    • D — None (Нет);
    • _ Not Stated (Не указано).

План работы

  1. Загрузка таблицы SQL
  2. Первичное исследование таблиц
  3. Cтатистический анализ факторов ДТП
  4. Создание модели для оценки водительского риска
  5. Анализ важности факторов ДТП
  6. Выводы

Решенные задачи

  1. Предобработка и исследовательский анализ данных. Поставлены различные задачи для коллег, указанные в третье пункте втором подпункет "Задачи для коллег", некоторые из которых имеют собственные примеры решения;
  2. Отобраны необходимые для модели параметри (всего 17), выбраны метрики для оценки их качества - F1-мера и AUC-ROC - и созданы следующие модели - DecisionTreeClassifier, RandomForestClassifier, LGBMClassifier и Нейронная сеть;
  3. Наилучший результат по метрике F1-мера показала Нейронная сеть с результатом 0.437, а по метрике AUC-ROC - LGBMClassifier с значением 0.545 (результат нейросети - 0.542). Однако нейросеть лучше определяет верноположительные ответы, что при данной задаче крайне важно;
  4. Наиважнейшим признаком является номер географических районов (county_city_location), однако даже его корреляция с целевым показателем - at_fault - довольно низка и составляет лишь 0.09;
  5. Рекомендовано использование Нейронной сети с увеличением количества эпох и батчей, а также усложнением архитектуры, но для этого необходима и более совершенная инфраструктура.

Используемые библиотеки

lightgbm, matplotlib, numpy, pandas, phik, sklearn, sqlalchemy, torch

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.